A Szilícium-völgy műszaki értelmisége Pause Giant AI Experiments: An Open Letter címmel írt nyílt levelet az MI kutatások fél éves felfüggesztésének szükségességéről, és különben is, mindenki skynetezik a ChatGPT nyomán mindjárt érkező szuperintelligenciától való félelmében. A fokozódó hangulat (amihez pl. ez a 444-cikk is jócskán hozzájárul) farvizén Gyuri és Feri arról vitatkoztak, itt van-e a szingularitás, bajban van-e a világ, mit gondoljunk Max Tegmark ról, értsünk-e egyet Madarász Tamás l...
May 12, 2023•48 min•Season 3Ep. 108
A Láncreakció mai vendége Fodor Gábor , a Kaggle machine learning versenyplatform grandmastere, aki ma a H2O.ai -nál dolgozik, ahol egyébként három másik nagymester felvételiztette. Már az egyetem alatt is indult versenyeken, de az első sikereit valamivel később érte el, például azon a madárhang-felismerő versenyen, ahol fütyörészést nem hallott, spektrum-ábrákat annál inkább, viszont azt sose tudhatta meg, melyik ábra melyik madárhoz tartozik. Mi értelme volt a Kaggle-nek régen és megváltozott-...
May 04, 2023•44 min•Season 3Ep. 107
Ezen a héten Huszti Dániel , az IBM adatelemzési szakértője volt a vendégünk és az IBM Cloud Pak for Data megoldáscsomag kapcsán szóba került a cég viszonya a nagy nyelvi modellek körüli hype-hoz, a beszerzések co-creation alapú megközelítése, a data fabric és data mesh közötti különbség, az etikus és a magyarázható MI, végül pedig a Monty Python Nemzetközi Filozófiai Futball közvetítése is....
Apr 27, 2023•45 min•Season 3Ep. 106
Mi is az a digitális gyarmatosítás és miért emlegetik ezt mostanában a nagy nyelvi modellek kapcsán újra és újra? Miért baj, ha nagyon sokan használják a Facebookot, hol csorbítja ez az államok hatalmát, és vajon mennyire használnak ki minket a nagy techcégek? Elvehetik-e például a nyelvünket, az egészségügyi rendszerünket vagy éppen a társadalomfejlődésre való képességeinket? De ami a legfőbb kérdés: mi köze van mindennek Gaspard de Prony trigonometriai táblázataihoz és a munkájukat vesztett fo...
Apr 20, 2023•53 min•Season 3Ep. 105
Mindig csak mások híreiről, eredményeiről mesélünk, de ezúttal a saját projektjeinkről, terveinkről számoltunk be. Gyula levezető elnök volt a Business Intelligence Konferencián és megfigyelt dolgokat az Export to Excel parancs környezetéről, illetve a célszalag felé tart az általa szervezett focis-adattudós verseny , Gyuri a 2023-as dataSTREAM konferenciát harangozta be, ami május 18-án lesz, illetve a július 3. és 7. között Veszprémben megrendezésre kerülő SPSS nyári iskolát reklámozta, Feri p...
Apr 13, 2023•45 min•Season 2Ep. 104
Vajon megvan-e az adattudós szakmában a naprakészen tartott tudás, az újdonságok követésének igénye és mennyire nehezíti ezt meg a rengeteg, sokszor marketing-bullshittól nagyra nőtt, szakirodalomnak látszó olvasnivaló? Gyula egy Linkedin-posztból válogatott néhány trendi kifejezést és megpróbált utánajárni, ezek tényleg újdonságok vagy csak régi témák újracsomagolt változatai....
Apr 06, 2023•44 min•Season 2Ep. 103
A Microsoft kiadott egy 150 oldalas tanulmányt a nemrég bejelentett GPT-4 képességeiről, ami a "Sparks of Artificial General Intelligence: Early experiments with GPT-4" címet viseli. Ennek tartalmát megismerve Gyuri megingott korábbi hitében, miszerint az AGI létrejötte lehetetlen, és Ferit és Gyulát is magával rántotta. A tanulmányt elemző videóból kiderül, hogy a GPT-4 képes az eszközhasználatra, a hazugságra, Fermi-kérdések megválaszolására, ceruzarajzok alapján weboldal készítésére és elmond...
Mar 31, 2023•46 min•Season 2Ep. 102
Merre mennek az MI-trendek? Erre a kérdésre úgy próbáltunk meg válaszolni, hogy végigmentünk egy tízes listán , amely a 2023-ban figyelemre érdemesnek mondott MI-startupokat sorolta fel, és elmondtuk, melyikről mit gondolunk, mire lesz jó, van-e esélye az elterjedésre, egyáltalán jó ötlet-e erre (is) használni a mesterséges intelligenciát? Ha az adásban elhangzott véleményekből indulunk ki, akkor a startup színtér nagy bajban van, de talán nem eszik ennyire forrón a kását......
Mar 23, 2023•51 min•Season 2Ep. 101
A századik adásban a Láncreakció stábja magát elemezte: mit mutat az adattudomány, ha a podcastunk hallgatottsági adatait vesszük górcső alá, és milyen mérőszámok és paraméterek hiányoznak a podcast mérés egyelőre vadnyugati állapotai miatt az eszköztárból. Ki beszél, amikor sokan hagyják el az adást? Milyen témák és formátumok rendelkeznek a legnagyobb hallgató-megtartó erővel? Érdekel-e valakit Ada Lovelace élete? Legyőzi-e a ChatGPT a Python-provokációt? A századik adásban minden kiderül!...
Mar 17, 2023•46 min•Season 2Ep. 100
Az adattudósoknak olyan a KDNuggets , mint influenszereknek a Youtube, vagy az űrkutatás iránt érdeklődőknek a Space.com - alap. Az oldalt egy orosz származású matematikus, Gregory Piatetsky-Shapiro alapította 1993-ban, amint ezt a 2021-es leköszönése alkalmából írott cikkében részletesen el is meséli. Az oldal története nem csak önmagában érdekes, hanem adattudósok számára hasznos tanulságokkal is szolgál, mint például hogy mit kezdjünk a nehéz természetű szakemberekkel, milyen alkalmazottakat ...
Mar 10, 2023•39 min•Season 2Ep. 99
A mai beszélgetés alapját az a TheVerge cikk adta, amelyben sorra veszik a Large Language Model-eken alapuló keresők (BingChat, Google Bard és társaik) veszélyeit, potenciális hibáit és hatásait. Mi ezen felül azt is megpróbáltuk megfejteni, van-e ezekre a veszélyekre gyógyír? A megfejtések keresése közben előkerült Magyarósi Csaba videója a szerelmes MI-ről, a New York Times cikke a ChatGPT-vel való beszélgetésről, és a Portfolió összeállítása a Big Tech cégek értékének az országok GDP-jével va...
Mar 02, 2023•46 min•Season 2Ep. 98
dr. Balkányi László orvosi tudásmérnökkel a Covid elmúlt 3 évének statisztikai tapasztalatairól beszélgettünk: hogy működik, milyen adatokra támaszkodik ez a terület - járványügyi hírszerző hálózat, MediSys és surveillance kifejezések is előkerültek -, hogyan működik a tudományos megközelítés és a politika, illetve a publikációs terület, ahol már AI is segít a tanulmányok előszűrésében pl. a Frontiers kiadónál. Mit tud és mit nem tudhat egy kutató, mire vonatkoznak a számok (pl. a többlethaláloz...
Feb 23, 2023•1 hr 4 min•Season 2Ep. 97
Immár két hónapja üzemel Elvira, a MÁV ügyfélszolgálati hangasszisztense, ami menetrendi tájékoztatást ad, vészhelyzeti hívásokat fogad, és azt is tudja, mit nem tud. A fejlesztést a Clementine végezte, a projekt tagjaival beszélgettünk az első hónapok tapasztalatairól. Milyen modulok és kód van mögötte, hogy fogalmaznak azok az utasok, akik meg akarják értetni magukat a robottal, miért és mennyit káromkodnak a hívásokban, milyen kihívásoknak kellett megfelelni a fejlesztés során és így tovább, ...
Feb 17, 2023•43 min•Season 2Ep. 96
Gyula megnézte a Brain Games című tévésorozatot és rájött, hogy az agyműködés titkainak megismerése bárkit hozzásegíthet ahhoz, hogy jobb előadó és meggyőzőbb adatelemző legyen belőle, Gyurinak pedig ehhez már csak Cyril Northcote Parkinson törvényei t kellett hozzátennie, hogy teljes legyen a konyhapszichológiai alapokra helyezett tanulságok vidám rendszere.
Feb 09, 2023•41 min•Season 2Ep. 95
Vajon mennyire váltak be a jóslataink, amiket tavaly ilyenkor tettünk a 2022-es évre? És a szakújságok hogyan teljesítettek? Szembesítjük magunkat és a hivatásosokat is, de nem átallunk 2023-mal kapcsolatos várakozásainknak is hangot adni, s közben megemlítünk olyan remek weboldalakat, mint a stateof.ai és az IEEE Spectrum .
Feb 02, 2023•50 min•Season 2Ep. 94
Megkíséreljük leleplezni a varázslatot, ami a Transformer nyelvi modelleket képessé teszi a formailag szinte tökéletes beszélgetésre. Ehhez először belenézünk a neurális hálók és mélytanulás múltjába, ehhez olyan fogalmakat nézünk meg, mint a backpropagation , a Common Crawl szerepe a megfelelő méretű korpuszok létrejöttében, a rekurrens neurális hálózatok és az LSTM modellek , továbbá elhangzott az egyik atyamester, Yoshua Bengio neve is. Megérkezünk a Google 2017-es cikkéhez ( Attention is all...
Jan 26, 2023•45 min•Season 2Ep. 93
A stateof.ai minden évben elkészülő gigantikus évösszegzője alapján mi is megbeszéltük, mi minden történt tavaly a mesterséges intelligencia háza táján. Megelőzte-e Kína az USA-t, merre mennek tovább a nyelvi modellek és vannak-e jobbak a GPT-3-nál, hol szivárognak az adatok a tudományos kutatásban, mennyi idő alatt jelennek meg az új eredmények open source változatban és így tovább: azaz mi történt tavaly és mi fog történni idén? Bónusz - kiderült, hogy Gyula új tanfolyamokat indít !...
Jan 19, 2023•50 min•Season 2Ep. 92
Januárban rendezték meg Las Vegasban a világ legnagyobb kütyüvásárát, a CES-t, ahol a metaverzum mellett a másik kulcsszó idén a mesterséges intelligencia volt. Ebben az epizódban azon elmélkedtünk, milyen technológiát nyomnak le az érdeklődők torkán az MI-re hivatkozva: van-e értelme az önvezető babakocsinak, a vizeletelemző vécérátétnek és az okossütőnek? És ha van is, jogos-e mindent az MI-re kenni?
Jan 12, 2023•45 min•Season 2Ep. 91
A conTEXT 2022 konferencián mutatta be a Clementine a MÁV új ügyfélszolgálati hangasszisztensét, az Elvirát, ennek örömére beszélgettünk a színpadon Fegyó Tiborral (SpeechText Kft.) és Németh Gézával (BME TMIT oktatója) a voicebotokról, magyar nyelvi korpuszokról, a hangalapú ember-gép kommunikáció kihívásairól.
Jan 06, 2023•49 min•Season 2Ep. 90
Először csak úgy indultunk neki, hogy összefoglaljuk az év MI és adattudományi történéseit, de aztán kiadtuk magunkból azt a sok frusztrációt is, amit ránk tukmált 2022. Mit jósolt a GPT-3 és a nagy elemzőcégek? Mi a baj a tudomány demokratizálódásával? Milyen bajok lesznek az OpenAI szöveggenerátorából? Kik vesztik el a munkájukat? Hová menjen 2022? Fanyar válaszok és némi reménysugár az év utolsó adásában.
Dec 29, 2022•40 min•Season 2Ep. 89
A Vizzu nevű magyar startup 2019 óta agyal azon, mennyivel jobb lenne, ha a grafikon magát magyarázná és akár az elemzést is lehetne vizuális eszközökkel végezni! Eredetileg a menedzsereket célozták, de most az adattudósok a fő közönségük, akiket imádnak a precíz visszajelzéseik miatt. Open source moduljaikat nemsokára magasabb szintű freemium eszközök követik. Velük beszélgettünk arról, milyen az út elején járni, milyen stratégiával lehet betörni erre a piacra és mit hozhat a jövő?...
Dec 21, 2022•47 min•Season 2Ep. 88
Az OTP AI kompetenciaközpont vezetője, Schin Lotar nemcsak a legnagyobb hazai bankcsoport MI-terveiről beszélt, hanem az adattárházak mai szerepéről, a felhőben tartott big data veszélyeiről, a 175 milliárd paraméter feleslegességéről és a földgázzal is ellátott ingatlanok magasabb értékéről.
Dec 15, 2022•47 min•Season 2Ep. 87
Megnéztük Vágujhelyi Ferenc NAV-elnök közelmúltbéli előadását , ami rengeteg dolgot eszünkbe juttatott. Egyrészt a kérdést, hogy mi is az a compliance , másrészt Gyuri és Gyula munka-emlékeit banki és biztosítási csalásokról, pénzmosásról, korrupcióról - mármint nem ezt csinálták munka közben, hanem adatbányászati módszerekkel támogatták ezek felismerését. Mennyibe kerül pénzt mosni, mi a legnehezebb az adócsalásban, jó-e bárkinek, ha a szélvédős okosba' megcsinálja CASCO-ra a betört üveget és e...
Dec 08, 2022•45 min•Season 2Ep. 86
A 80-20 szabály névadója, Vilfredo Pareto életével és emlékezetével foglalkoztunk ezen a héten, hiszen őt tartják az adatalapú közgazdaságtan megalapozójának. Igaz, hogy később sokan (egyebek között a Nobel-díjas Amartya Sen ) vitatták nézeteit, ráadásul a Pareto-elvet nem ő, hanem egy amerikai menedzsment-tanácsadó ( Joseph M. Juran ) alkotta meg Pareto halála után közel két évtizeddel, ám mégis Paretóra hivatkozunk számtalan megállapítást és mémet emlegetve. Az adás elején pedig felhívtuk a fi...
Dec 01, 2022•45 min•Season 2Ep. 85
Egyszer ennek is neki kellett veselkedni: megpróbáltuk összeszedni azokat a bosszantóan közhelyes állításokat, amik részben az adattudományról nyilatkozók, részben az azt művelők szájából hangzanak el és ha egykor talán igazak is voltak, mára elvesztették igazságtartalmuk jó részét. Eközben megidéztük Hofi Géza szellemét egyik a statisztikáról szóló előadásrészletével, illetve ajánlottuk a conTEXT 2022 konferenciát is, amelyről ezen a linken találhatóak a részletek....
Nov 25, 2022•44 min•Season 2Ep. 84
Vajon levezethető-e Kína valós GDP adata az országról készült éjszakai űrfelvételekből? És a magánházak medencéiben bekövetkezett fulladásos halálok száma Nicolas Cage adott évben megjelent filmjeinek mennyiségéből? Az adattudomány fő ígérete, hogy eddig rejtett összefüggéseket is megtalálhatunk az adatok elemzésével, de ezek a módszerek könnyen tévútra terelhetnek, avagy mi a különbség hipotézis és spekuláció között? A Spurious Correlations weboldal szórakoztató grafikonjai mellett a kínai GDP ...
Nov 17, 2022•47 min•Season 2Ep. 83
A zene és a mesterséges intelligencia kapcsolatáról Nóniusz Gáborral, a Láncreakciónak is otthont adó hangstúdió vezetőjével beszélgettünk, és miközben megfejtettük, kinek veszi el a munkáját ebben az iparágban az MI, egy sor zenei fogalom és sztori előkerült. Szóba jött a Delay effekt , a MIDI szabvány , Presser Electromantic című lemeze és Giorgio Moroder munkássága, egy cikk arról, hogy az MI a zeneipar melyik műveleteiben juthat szerephez , milyen Nirvana számot írt a Tensorflow-alapú Magent...
Nov 10, 2022•53 min•Season 2Ep. 82
Vendégünkkel, Gáspár Csabával, a BME TMIT kutatójával a Python történelméről és jövőjéről beszélgettünk: mi köze a Monty Python csoporthoz, miért vált az adattudomány latinjává, hogyan győzte le a Clementine-t vagy Rapid Minert, majd gyűrte maga alá az R-t, és vajon tényleg ez lesz-e az emberiség utolsó programnyelve?
Nov 03, 2022•50 min•Season 2Ep. 81
Az adattisztítás fontossága és lehetetlensége igazán szép ellentmondása az adatelemzői hivatásnak. Értik-e a megrendelők az adatminőség fogalmát, egyáltalán van-e ilyen, illetve mit gondoljunk arról a tételről, hogy a nem megfelelő minőségű adat nem jelenti annak használhatatlanságát? Elhisszük-e, hogy a cégek adatainak mindössze 3%-a használható ? Áttekintettük az adatminőség menedzselésére szolgáló szoftveres megoldások lehetőségeit, de még inkább a filozófiai síkot, ami a gyakorlati megoldáso...
Oct 28, 2022•41 min•Season 2Ep. 80
Milyen szerepet játszik a mesterséges intelligencia az orosz-ukrán háborúban? Rengeteg cikk jelenik meg a témában, alig győztünk válogatni közülük! Beszélhettünk általában az új technológiák felhasználásáról , a szimulációk fontosságáról és a háború során keletkező adatok felhasználásáról és általában a konfliktus, mint tesztkörnyezet szerepéről , sőt a hadiipari startupok előretöréséről is. Gyuri hivatkozott von Schlieffen tábornokra, illetve szóba került a minimum megosztó Peter Thiel és az eg...
Oct 20, 2022•42 min•Season 2Ep. 79