AI tudástérkép: az AI technológiák osztályozása

Az új AI technológiai tájkép vázlata

A cikk rövidebb változata először a Forbes-en jelent meg

A cikket a KDnuggets ezüst kitűzővel is elnyerte, mint az egyik legolvasottabb és megosztottabb 2018 augusztusban.

I. Bevezető gondolatok

Egy ideje tartózkodtam a mesterséges intelligencia területén, és tisztában vagyok azzal, hogy több osztályozás, megkülönböztetés, táj és infographics létezik, hogy képviselje és nyomon kövesse az AI gondolkodásának különféle módjait. Ugyanakkor nem vagyok nagy rajongója ezeknek a kategorizálási gyakorlatoknak, főleg azért, mert azt gondolom, hogy a dinamikus adatpontok előre meghatározott javítódobozokba történő besorolása gyakran nem éri meg az ilyen „egyértelmű” keretrendszer előnyeit (ez egy általánosítás természetesen, mert néha rendkívül hasznosak).

Ami a mesterséges intelligenciát illeti, azt is gondolom, hogy a létező kategóriák sokai vagy hiányosak, vagy nem képesek megragadni ennek az új AI-hullámnak az erős alapvető kapcsolatait és aspektusait.

Tehát hadd mondjam el először a levél indokát. Együttműködve a Chôra stratégiai innovációs ügynökséggel, egy vizuális eszközt akartunk létrehozni az emberek számára, hogy egy pillanat alatt megértsék ennek az eszközkészletnek a komplexitását és mélységét, valamint egy olyan térképet készítsünk, amely segíthet az AI dzsungelben orientálódó embereknek. A következő grafikont úgy kell megvizsgálnia, hogy hogyan strukturálhatja a strukturálatlan tudást egyfajta ontológiába azzal a végső céllal, hogy nem pontosan ábrázolja az összes meglévő információt az AI-n, hanem hogy rendelkezzen egy eszközzel az információkészlet egy részének leírására és elérésére.

Az alábbiakban arra törekszünk, hogy felépítsünk egy architektúrát az AI-tudáshoz való hozzáféréshez és a kialakuló dinamika követéséhez. Ez egy átjáró a témában meglévő ismeretekhez, amely lehetővé teszi a további információk felkutatását és új tudás létrehozását az AI-n.

A végső munka hasznosságának tehát elő kell segítenie három dolog elérését: megérteni a folyamatot, és rendelkeznie kell egy térképpel, amely követi az utat; annak megértése, hogy hol használják a gépi intelligenciát (tekintetbe véve, hogy a múltban nem használták fel); annak megértése, hogy mit és hány problémát fogalmaznak meg, hogy lehetővé tegyék az AI számára a problémák kezelését (ha ismeri Agrawal és mtsai. munkáját, 2018 ezek a jóslati technológiák költségcsökkenésének közvetlen következményei).

Ez a cikk elvben mind az AI-ben kezdődő embereket célozza meg, hogy átfogó képet kapjanak a dolgokról, mind a szakértőket és a szakembereket, akik egy ideje kísérleteznek ezekkel a technológiákkal (kifejezett kéréssel, hogy küldjek nekem visszajelzést arról, hogyan szerkesztené, vagy más technológiákat, amelyeket az AI spektrumnak be kell vonnia).

Nagyon is tisztában vagyok azzal, hogy ez egy ambiciózus feladat, tehát egyszerűen csak egy első tervezetként vagy kísérletként tekinteni erre, mint egy végleges beépített megoldással.

Engedjék meg, hogy befejezzem ezt a bevezetést valaminel, amit rájöttem arra, hogy elérjem a látvány létrehozásának célját: ez nagyon-nagyon nehéz. Rendkívül nagy kihívást jelentett a lehető legtöbb információ ábrázolása egy kétdimenziós, nem egyértelmű térképen. Olyan dolgot nem tud felfedezni, amíg meg nem próbálja megtenni magát. Felhívom mindnyájan, hogy tegyék meg ugyanazt a megértést, amit értem (hidd el, ez egyáltalán nem könnyű, különös tekintettel az AI által az elmúlt 60 évben alkalmazott vélemények, nézőpontok és megközelítések közötti eltérésekre). Ez a végső felelősségi nyilatkozathoz vezet: néha a pontosság és az egyértelműség közötti kompromisszum fenntartása érdekében hozzá kellett közelítenem a fogalmakat vagy magát a besorolást, tehát előzetesen bocsáss meg nekem valamilyen kisebb (vagy valaki számára jelentős) téves állítás miatt.

Tegyük fel most az AI tudástérképet (AIKM).

II. Problémakör + megközelítés = technológiai megoldás

Tehát itt vagyunk, ennyi. Valószínűleg azt várták, hogy a bevezetéskor egy furcsa VR-motor beépíti az egyes technológiákhoz több fénycsomagot, ám ez egy régimódi kétdimenziós grafikon. Ilyen egyszerű az egész.

Nézzük meg kissé közelebbről.

A tengelyen két makrocsoport található, azaz az AI paradigmák és az AI problématartományok. Az AI paradigmák (X tengely) valóban azok a megközelítések, amelyeket az AI kutatói használnak az AI-val kapcsolatos speciális problémák megoldására (magában foglalja azokat a megközelítéseket, amelyekről napjainkban tisztában vagyunk). A másik oldalon az AI problématartományai (Y tengely) történelmileg azok a problémák, amelyeket az AI meg tudja oldani. Bizonyos értelemben ez azt is jelzi, hogy egy AI-technológia potenciális képességeket kínál.

Ezért a következő AI paradigmákat azonosítottam:

  • Logikai alapú eszközök: eszközök, amelyeket a tudás ábrázolásához és a problémamegoldáshoz használnak;
  • Tudásalapú eszközök: ontológiákon és fogalmak, információk és szabályok hatalmas adatbázisán alapuló eszközök;
  • Valószínűségi módszerek: eszközök, amelyek lehetővé teszik az ügynököknek, hogy hiányos információs forgatókönyvekben cselekedjenek;
  • Gépi tanulás: olyan eszközök, amelyek lehetővé teszik a számítógépeknek az adatokból való tanulást;
  • Beágyazott intelligencia: mérnöki eszközkészlet, amely feltételezi, hogy a magasabb intelligencia eléréséhez testre (vagy legalább részleges funkciók sorozatára, például mozgásra, észlelésre, interakcióra és megjelenítésre) van szükség;
  • Keresés és optimalizálás: olyan eszközök, amelyek intelligens keresést tesznek lehetővé számos lehetséges megoldáson keresztül.

Ez a hat paradigma szintén három különböző makro-megközelítésre osztható, nevezetesen szimbolikus, szub-szimbolikus és statisztikai (különböző színek képviselik). Röviden: a szimbolikus megközelítés kijelenti, hogy az emberi intelligencia redukálható szimbólummanipulációra, az alszimbolikus megközelítésre, amely szerint nem szabad előzetesen megadni a tudás konkrét reprezentációját, míg a statisztikai megközelítés matematikai eszközökön alapszik, amelyek konkrét alproblémák megoldására szolgálnak.

Gyors kiegészítő megjegyzés: hallhatjuk, hogy az „AI törzsekről” beszélnek - ez egy olyan koncepció, amelyet Pedro Domingos (2015) javasolt, és amely a kutatókat csoportosítja a problémák megoldására alkalmazott megközelítések alapján. Ezt az öt törzset könnyen leképezheti a paradigma besorolással (nem veszi figyelembe a megtestesített intelligenciacsoportot), azaz a szimbolisták logikai alapú megközelítéssel (absztrakt szimbólumokon alapuló logikai érvelést használnak); Connectionisták gépi tanulással (az emlősök agya ihlette őket); Evolúciók kereséssel és optimalizálással (a darwini evolúció ihlette); Bayes-ek valószínűségi módszerekkel (valószínűségi modellezést alkalmaznak); végül pedig tudásalapú módszerek elemzői, mivel megpróbálják extrapolálni a meglévő ismereteket és a korábbi hasonló eseteket.

A függőleges tengely ehelyett azokat a problémákat határozza meg, amelyekkel az AI-t használták, és az itt megadott osztályozás meglehetősen szabványos:

  • Indokolás: képesség a problémák megoldására;
  • Tudás: a világ képviseletének és megértésének képessége;
  • Tervezés: képesség a célok kitűzésére és elérésére;
  • Kommunikáció: a nyelv megértésének és kommunikációjának képessége;
  • Percepció: az a képesség, hogy a nyers szenzoros bemeneteket (például képeket, hangokat stb.) Felhasználható információkká alakítsuk.

Még mindig azt kérdezem, vajon ez a besorolás elég nagy-e ahhoz, hogy megragadja a jelenleg felmerülő problémák összes spektrumát, vagy kell-e további példányokat hozzáadni (például kreativitás vagy mozgás). Egyelőre azonban az öt klaszterrel maradok.

A dobozok mintái ehelyett a technológiákat két csoportra osztják, azaz szűk alkalmazásokra és általános alkalmazásokra. A használt szavak szándékosan kissé félrevezetők, de egy pillanatra magukkal viselnek, és elmagyarázom, hogy mire gondoltam. Az AI-ben kezdődő személyek számára a legfontosabb a gyenge / keskeny AI (ANI), az erős / általános AI (AGI) és a mesterséges szuper intelligencia (ASI) közötti különbség ismerete. Az egyértelműség kedvéért az ASI egyszerűen egy naprakész spekuláció, az AI általános célja a kutatók végső célja és szent grálja, míg a keskeny AI valójában van ma, azaz olyan technológiák összessége, amelyek semmivel sem képesek megbirkózni. alkalmazási körén kívül esik (ami a legfontosabb különbség az AGI-hez képest).

A grafikonban használt kétféle vonal (folytonos és pontozott) kifejezetten rámutat erre a különbségre, és meggyőződni róla, hogy amikor más bevezető AI anyagot olvas, akkor nem fog teljesen elveszni. Ugyanakkor ugyanakkor a különbség itt azokat a technológiákat vázolja fel, amelyek csak egy adott feladatot tudnak megoldani (általában jobban, mint az emberek - Keskeny alkalmazások), és másokat, amelyek ma vagy a jövőben több feladatot tudnak megoldani és kölcsönhatásba lépnek a világgal (jobb, mint sok embernél) - Általános alkalmazások).

Végül nézzük meg, mi van benne a grafikonon. A térképen az AI technológiák különböző osztályai vannak ábrázolva. Megjegyzés: szándékosan nem nevezem el bizonyos algoritmusokat, hanem inkább makrócsoportokba csoportosítom őket. Sem azért nem adom meg Önnek az értékelését, hogy mi működik, és mi nem, hanem egyszerűen felsorolom, mit kutatók és adattudósok használhatnak.

Tehát hogyan tudja elolvasni és értelmezni a térképet? Nos, hadd adjak neked két példát, hogy segítsen abban. Ha megnézzük a Természetes Nyelvi Feldolgozást, ez beépíti az algoritmusok olyan osztályát, amely tudás-alapú megközelítés, gépi tanulás és valószínűségi módszerek kombinációját használja az észlelés területén felmerülő problémák megoldására. Ugyanakkor, ha a logikai alapú paradigma és az érvelési problémák kereszteződésének üres helyét nézi, akkor kíváncsi lehet, hogy miért nem léteznek ott technológiák. A térképet nem az jelenti, hogy kategorikusan nem létezik olyan módszer, amely kitölti ezt a helyet, hanem az, hogy amikor az érvelési problémákhoz közelednek, inkább például a Machine Learning megközelítést használják.

Ennek a magyarázatnak a befejezéséhez a technológiák teljes listája a saját meghatározásukkal együtt:

  • Robotikus folyamat automatizálás (RPA): technológia, amely kibontja a végrehajtandó szabályok és műveletek listáját, figyelve a felhasználót egy bizonyos feladat elvégzésére;
  • Szakértői rendszerek: számítógépes program, amelynek keményen kódolt szabályai vannak az emberi döntéshozatali folyamat utánozására. A homályos rendszerek a szabályalapú rendszerek sajátos példája, amelyek a változókat 0 és 1 közötti értékek kontinuumává térképezik, ellentétben a hagyományos digitális logikával, amely 0/1 eredményt eredményez;
  • Számítógépes látás (CV): a digitális képek megszerzésének és értelmezésének módszerei (általában tevékenységek felismerésére, képfelismerésre és gépi látásra felosztva);
  • Természetes nyelvi feldolgozás (NLP): almező, amely a természetes nyelvi adatokat kezeli (ebbe a mezőbe három fő blokk tartozik, azaz a nyelv megértése, a nyelv generálása és a gépi fordítás);
  • Neurális hálózatok (NN-k vagy ANN-k): az emberi / állati agy idegsejtszerkezete után lazán modellezett algoritmusok olyan osztálya, amely javítja teljesítményét anélkül, hogy kifejezetten arra utasítanák, hogyan kell ezt megtenni. Az NN két fő és ismert alosztálya a Deep Learning (többrétegű neurális hálózat) és a Generative Adversarial Networks (GAN - két hálózat, amely egymást kiképezi);
  • Autonóm rendszerek: alteret, amely a robotika és az intelligens rendszerek metszéspontjában fekszik (pl. Intelligens érzékelés, ügyes tárgymanipuláció, terv alapú robotvezérlés stb.);
  • Elosztott mesterséges intelligencia (DAI): a technológiák olyan osztálya, amely megoldja a problémákat azáltal, hogy elosztja azokat egymással kölcsönhatásban álló autonóm „ügynököknek”. A multi-agent rendszerek (MAS), az agent-alapú modellezés (ABM) és a Swarm Intelligence három hasznos specifikációja ennek az alkészletnek, ahol a kollektív viselkedés a decentralizált önszerveződéses ügynökök kölcsönhatásából fakad;
  • Hatékony számítástechnika: egy olyan almező, amely az érzelmek felismerésével, értelmezésével és szimulációjával foglalkozik;
  • Evolúciós algoritmusok (EA): egy szélesebb számítástechnikai terület egy részhalmaza, az úgynevezett evolúciós számítás, amely a biológia ihlette mechanizmusokat (pl. Mutáció, reprodukció stb.) Használja az optimális megoldások keresésére. A genetikai algoritmusok az EA-k leggyakrabban használt alcsoportjai, amelyek keresési heurisztikák, amelyek a természetes kiválasztási folyamatot követik a „legalkalmasabb” jelölt megoldás kiválasztására;
  • Induktív logikai programozás (ILP): almező, amely formális logikát használ a tények adatbázisának ábrázolására és az ezekből az adatokból származó hipotézis megfogalmazására;
  • Döntési hálózatok: a legismertebb bayes-i hálózatok / következtetések általánosítása, amelyek egy változó halmazát és azok valószínűségi viszonyait ábrázolják egy térképen (más néven irányított aciklikus gráf);
  • Valószínűségi programozás: olyan keret, amely nem kényszeríti az adott változó merev kódolására, hanem valószínűségi modellekkel működik. A bayes-i programszintézis (BPS) valamilyen módon egy valószínűségi programozás, ahol a bayes-i programok új bayes-programokat írnak (az emberek helyett ezt teszik, mint a szélesebb valószínűségű programozási megközelítésben);
  • Környezeti intelligencia (AmI): olyan keret, amely megköveteli a fizikai eszközöket a digitális környezetbe, hogy érzékeljék, érzékeljék és környezettudatosan reagáljanak egy külső ingerre (általában egy emberi cselekvés váltja ki).

Egy adott probléma megoldása érdekében egy vagy több megközelítést követhet, ez pedig egy vagy több technológiát jelent, mivel sokuk egyáltalán nem zárja ki egymást, hanem inkább kiegészíti egymást.

Végül van egy másik releváns osztályozás, amelyet még nem ágyaztam be a fenti grafikonba (azaz a különféle elemzési típusokba), de a teljesség kedvéért érdemes megemlíteni. Valójában öt különféle elemzési módszerrel találkozhat: leíró elemzés (mi történt); diagnosztikai elemzés (miért történt valami); prediktív elemzés (mi fog történni); vényköteles elemzés (tevékenységek ajánlása); és automatizált elemzés (a műveletek automatikus elvégzése). Arra is kísértés lehet, hogy felhasználja a fenti technológiák valamilyen osztályozására, de a valóság az, hogy ez funkcionális osztályozás és folyamat, nem pedig termékspecifikáció - más szóval, a spektrum minden technológiája képes teljesíteni ezt az öt elemzési funkciót .

III. Következtetés

A számítógépeknek a tanulás megtanítása anélkül, hogy kifejezetten programozni kellene, egy nehéz feladat, amely több technológiát foglal magában több árnyalattal szemben, és bár ez a térkép messze nem tökéletes, ez legalább az első kísérlet a rendetlen táj, mint a mesterséges intelligencia.

Teljesen tisztában vagyok azzal, hogy egy erős Pareto-elv jelenik meg itt, azaz hogy a jelenlegi erőfeszítések és eredmények 80% -át (ha nem is több) a térképen ábrázolt technológiák (nevezetesen a mélytanulás, az NLP és a számítógép) 20% -a hajtja meg. ), de biztos vagyok abban is, hogy a teljes spektrummal segíthetnek a kutatók, az induló vállalkozók és a befektetők.

Amellett, hogy megpróbálom beágyazani és figyelembe venni az első verzióra vonatkozó visszajelzéseket és megjegyzéseket, a jövőben két további lépést tervezem megtenni: az egyik egy réteg létrehozása az AI kihívásaihoz (pl. Memóriaproblémák és katasztrofális felejtés, átadni a tanulást, kevesebb adatból történő tanulást olyan dolgokkal, mint a nulla és az egyfokozatú tanulás stb.), és milyen technológiával lehet leküzdeni az adott kérdést. Másodszor: próbáltam lencséket alkalmazni a különféle technológiák és nem a megoldandó problémák áttekintésére, hanem inkább az általuk létrehozott problémákra (például etikai kérdések, adatigényes problémák, fekete doboz és magyarázhatósági problémák stb.).

Ha bármilyen észrevétele van a meglévő munka javításával kapcsolatban, vagy javaslata van e két további lépés beágyazására, kérjük, vegye fel a kapcsolatot!

És ha Ön olyan vállalat, amely a fent említett technológiák bármelyikével foglalkozik, szeretnék többet hallani rólad.

Nyilvánosság: Az AI tudástérképet az Axilo stratégiai innovációs tanácsadással fejlesztették ki a Chôra platformon végzett tevékenységekhez.

Irodalom

Agrawal, A., Gans, J., Goldfarb, A. (2018). „Jóslásgépek: A mesterséges intelligencia egyszerű gazdaságtan”. Harvard Business Review Press.

Domingos, P. (2015). „A fő algoritmus: Hogyan alakíthatja át a végső tanulógép keresése a világunkat”. New York: Alapvető könyvek.