Multidiszciplináris workshop a pszichológiai fókuszú Big Data elemzésekről
Időpont: 2024. február 12.
Szervező: Dr. Lukács Gergely, elérhetősége: lukacs.gergely@itk.ppke.hu
- 12:30 – Dr. Lukács Gergely: Bevezető
- 12:35 – Dr. Kővágó Pál, PPKE-BTK Pszichológiai Intézet: Pszichológiai tartalomelemzés alapjai
- A pszichológiai tartalomelemzés paradigmája szerint az emberi elbeszélések, történetek vagy más emberek által létrehozott tartalmak információkat hordoznak a tartalmat létrehozó személy vagy csoport mentális jellemzőiről. Az előadásban röviden bemutatásra kerülnek a főbb pszichológiai tartalomelemzési módszerek, eljárások, valamint a pszichológiai tartalomelemzés gyakori kutatási kérdései.
- 13:05 – Dr. Ehmann Bea, HUN-REN TTK KPI: Izolált, összezárt kiscsoportok pszichodinamikájának tartalomelemzéses vizsgálata
- Az előadás szélsőséges környezeti körülmények között elszigetelt, összezárt, ún. ICE-csoportok (=Isolated, Confined and Extreme) pszichodinamikájának távoli elemzését mutatja be. Az űrpszichológiában a pszichológiai vizsgálatok egy részét földi űranalóg helyszíneken végzik. Ilyen helyszínnek tekinthetők az antarktiszi kutatóállomások is. A European Space Agency keretében végzett vizsgálatunkban két áttelelő csoport (britek és franciák) által készített naplókat tartalomelemeztünk különféle módszerekkel. A módszert és az eredményeket mutatjuk be.
- 13:35 – Dr. Lukács Gergely: Közösségi média adatok elemzése
- A közösségi média üzleti modellje a felhasználói adatok gyűjtése és üzleti célú hasznosítása. A gyűjtött adatok ugyanakkor társadalomkutatási célokra is hasznosak, bár elérhetőségük ilyen célra nem magától értődő, korlátozott. Az előadás a közösségi médiában l (pl. Instagram, Google) gyűjtött adatok körét, ezek kutatási célra történő elérhetősi lehetőségeit és korlátait, valamint a szükséges technikai, Big Data kezelő és elemző infrastruktúrát tekinti át.
- 14:05 – 14:20 szünet
- 14:20 – Dr. Yang Zijian Győző, Nyelvtudományi Kutatóközpont: Nagy nyelvi modellek és mesterséges intelligencia alapú szövegelemzés
- A nyelvtechnológia tudományága egyidős a modern számítógéppel. A szabályalapú megoldásoktól a statisztikai módszereken át a neurális modellekig. Az igazi áttörést a neurális módszerek hozták, azon belül is a transzformer architektúra. A transzformer segítségével a modell rendkívül finom környezetfüggő összefüggéseket és tudást képes megtanulni a szövegből. Megjelenése átalakította a folyamatokat a nyelvtechnológiában, a feladatmegoldás kétlépcsős lett: előtanítás és finomhangolás. Az előtanítás során egy nyelvmodellt tanítunk általános nyelvtudásra, majd a finomhangolás útján tovább tanítjuk az előtanított nyelvmodellt feladatspecifikus tudásra. Ezzel a megoldással szinte minden nyelvtechnológiai feladatban piacvezető (state-of-the-art) eredményeket értek el.
- A transzformer modellben rejlő potenciált megsejtették a nagy vállalatok és belekezdtek egy nyelvmodellezési versenybe. Az elmúlt években nagyobbnál nagyobb nyelvmodelleket tanítottak nagyobbnál nagyobb adathalmazokon. Jelenleg az élen az OpenAI jár a GPT (Generative pre-trained transformers) modellekkel és az azok finomhangolásával előállított ChatGPT alkalmazással. Jelenleg az egyik legnagyobb nyelvmodell ami létezik az a GPT-4, ami 1,76 billió paraméterszámmal rendelkezik. A GPT-4 egy multimodális modell, ami a szöveg mellett képet is képes feldolgozni. A ChatGPT sikerének egyik kulcsa, hogy egy ilyen nagy nyelvi modell (large language model – LLM) áll mögötte és szolgáltatja a tudásának az alapját. Másik kulcsfontosságú rész az emberi visszajelzések integrálása. A modell a finomhangolás során a megerősítéses tanulás módszerével figyelembe veszi az emberi visszajelzéseket. Ezzel a módszerrel a modell megtanul sokkal „emberibb” válaszokat adni.
- 15:20 – Pódiumbeszélgetés
- 16:30 – Laborbemutató (321. Adat.Média.Közösség)