GenAI alapú pénzügyi adatletöltés lépésről lépésre– hogyan (NE) szelidítsd meg a Pythont

Ez a bejegyzés szervesen kapcsolódik az előző kettőhöz. Érdemes azokat is átfutnod, ha még nem tetted meg:

  1. Adatforrás ajánlások
  2. Demokratizált pénzügyi adatgyűjtés – az API-któl a (Monty) Pythonig

Ebben a részben azt demonstrálom, hogy a tipikus Tudatos KisBefektető, aki egyben kezelni szeretné a módszertani kockázatokat is, elvben hogyan tudná használni a generatív AI-t (GenAI) pénzügyi adatletöltéshez (részvényelemzési céllal) anélkül, hogy bármilyen fogalma és előzetes tapasztalata lenne az API-król és a Python programnyelvről.

Előre nyomatékosítom: habár, amint látni fogod, működni fog az AI-megoldás, mégis SOHA, SEMMILYEN KÖRÜLMÉNYEK KÖZÖTT NE hagyatkozz tisztán erre! Pont az benne a veszélyes, hogy bármit kérdezel, a GenAI fog meggyőző választ adni. Aztán, ha bebuktad, akkor udvariasan bocsánatot kér, és méltat majd, hogy milyen nagyszerű észrevételeid vannak. Csak téged ez már nem fog vigasztalni.

A GenAI egy eszköz, vagy akár tekinthetsz rá úgy is, mint egy nagyon képzett beosztottra egy vállalkozásban (ebben az esetben részvénybefektetés célú adatelemzésnél). De a főnöknek neked kell lenned. Ez viszont azt jelenti, hogy fel vagy vértezve azzal a tudással, ami alapján ellenőrizni, irányítani tudod a beosztottadat.

Ezért – és itt spoilerezek – a végső megoldás az, hogy valamilyen szintű data science- és programozási (tipikusan Python) alapismereteket el kell majd sajátítanod (későbbi posztok és tanfolyam), és meg kell tanulnod, hogy ilyen kérdésekben hogyan használd a GenAI-t az elemzési munkád során.

Ez a bejegyzés azt a célt szolgálja, hogy érzékeltesse a GenAI jelenlegi (2026 január) szintjének erejét. Ennek eredményeként pedig az Olvasó eldönthesse azt a mostanában formálódó „vitát”, hogy vajon hasznos-e az AI, vagy csak egy „lufi” (itt most szakmai értelemben értem a lufit, nem pénzügyi, tőzsdei értelemben). Megtérülő befektetés-e, vagy elsüllyedt költség?

Előre szaladok: ezen a szinten, ilyen alkalmazások tekintetében mindenképpen megtérülő befektetés. De – újra – csak akkor, ha felkészülten használod, és még véletlenül sem úgy, ahogy ez a bejegyzés esetleg sugallhatja.

A másik fontos figyelmeztetés: ez a tartalom nem a SimFin szolgáltatás oktatása. A SimFin-t példaként használom, nem ajánlásként. A folyamatot szeretném bemutatni, és nem oktatóanyagot közreadni.

A SimFin-t ugyanakkor pont azért választottam, mert ők egyedülálló módon (biztos van ilyen másoknál is) kidolgoztak a SimFin API-k használatára egy olyan megoldást, ami nem fejlesztőknek, hanem a témában járatlan felhasználóknak is szól. Ezt is be fogom mutatni a későbbi részekben.

Szemfüles Olvasó okkal teheti fel a kérdést, hogy akkor minek szenvedünk itt az AI-jal egyáltalán? A válasz egyfelől az előző bekezdés végén található (nem minden API felhasználóbarát), másfelől abban a pillanatban, hogy egy szolgáltató saját megoldására bízzuk magunkat, szembesülnünk kell a módszertani kockázattal.

Simán mondhatod, hogy téged ez nem érdekel, és tök jó, hogy megoldották helyetted az API-kérdést és azt fogod használni – de ez a te döntésed. Ez a blog azonban azoknak szól, akik nem csekkolnak ki egy kényelmes megoldás esetén, hanem igyekeznek saját ellenőrzésük alatt tartani az eseményeket.

OK. Akkor végre kanyarodjunk rá a GenAI-ra. Itt javaslok átolvasni egy gyors áttekintést.

Az adatelemzési feladataimhoz csak fizetős GenAI-megoldásokkal dolgoztam, tipikusan legalább kettővel. Eddig a Gemini-t, a ChatGPT-t és a Perplexity-t használtam. Azt tapasztaltam, hogy ezek képességei folyamatosan változnak egymáshoz képest.

Például 2024-ben, amikor a Google Data Analytics kurzust csináltam, kifejezetten kódgenerálásra a Gemini-t ajánlották (persze mi mást ajánlottak volna egy Google-kurzuson 😊). Később aztán azt láttam, hogy a ChatGPT végül „rávert” a Gemini-re (mostanra a Gemini újra elég jól feljött).

Ugyanakkor, ha komoly kutatást kellett végeznem, akkor a Perplexity bizonyult jobbnak. Sokáig úgy használtam a GenAI-t, hogy kutatásra a Perplexity-t, míg kódgenerálásra a ChatGPT-t vettem elő. Mára azonban a Perplexity kódjai is megfelelőnek bizonyultak, így kutatásra és kódgenerálásra is azt használom, és a ChatGPT-vel dupla csekkolok.

Azt már valamelyik korábbi bejegyzésemben említettem, hogy nagyon fontosnak tartom, hogy az elemzés bármely szakaszán az eszközöket, módszertanokat ütköztesd másokkal, és figyeld a kimenetek szórását és együttmozgását.

Jelenleg (2026 január) tehát a Perplexity Pro-t használom web/academic és social keresési forrásbeállításokkal, a ChatGPT 5.2-vel együtt.

Renben. A GenAI bekészítve, jöjjön az adatforrás: www.simfin.com

Ehhez a gyakorlathoz elég lesz egy ingyenes accountot nyitnod:

Az ingyenes accounttal korlátozott adatokat fogsz kapni, ezeket értelemszerűen NE használd konkrét részvényelemzéshez. Az adatelemzés gyakorlásához azonban ideálisak.

Miután bejutottál a felületre, a bal oldali sávban kiválaszthatod az API-kat. Mindenekelőtt röviden az API-król. Bár onnantól, hogy a nulladik lépés a GenAI „izzítása” volt, bátran megkérdezheted tőle is 😉.

A prompt függvényében a majdnem végtelen sok lehetséges válasz közül ez lehet az egyik
(!AI ALERT!: igen, ez a pár dőlt betűs sor AI-tartalom 😊):

Az API olyan, mint egy pincér két rendszer között. Te megmondod, mit szeretnél (például pénzügyi adatokat), az API pedig szabályozott módon elkéri azt egy másik szolgáltatástól, majd átadja neked az eredményt – emberi kattintgatás nélkül.

Másképp mondva:

👉 az API megmondja, hogyan lehet adatot kérni

👉 milyen formában kapod meg

👉 és mit nem lehet csinálni

Ezért tud ma egy program automatikusan részvényadatokat, időjárást vagy árfolyamokat lekérni – anélkül, hogy bárki böngészőt nyitna.

Vedd észre, hogy akár kezelhetnéd az adatletöltést manuálisan és excel plugin segítségével is. Az előző részben már jeleztem és akkor most újra ideteszem, hogy mindez szép és jó, csak ha egy kicsit tapasztalt vagy a részvényelemzés világában, bele se kezdesz ezekbe, mert nagyon hamar “bekönyököl” a rögvalóság a data science és azon belül a Python alapok igényének formájában. Sok-sok hónapot töltöttem el ezekkel, mire elfogadtam, hogy a profi részvényelemzés során a manuális, de még a “feketeöves” exceles gakorlat is hamar kapitulálnak. Spóroljuk ezt meg és álljunk bele mindjárt a Python API-kba!

Ezen a felületen megtalálod a személyesen számodra generált API-kódot, amit én most kitakartam. Te se propagáld ezt, hanem mentsd el. Utána kattints a „bulk download page”-re, majd görgess le.

Részvényelemzőknek és adatos szakembereknek szemet gyönyörködtető látvány fogad: a letölthető adatok listája.

Itt álljunk meg egy pillanatra, és a Derived Figures & Ratios adatok példáján hadd emlékeztesselek újra arra, hogy mit jelent a módszertani kockázat, és annak kezeléséhez miért kell majd némi data science- és Python alapot elsajátítanod. Ha megnyitod ezt a datasetet, akkor ezt látod:

Ez egyrészt általánosságban egy szép példája a data science egyik szabályának, ti.: az adatokkal kapcsolatban illik pontos útmutatást adni. Azt is látod, hogy bizonyos tartalmak csak fizetés ellenében tölthetők le (ilyen a Derived Figures & Ratios is). Nekünk azonban elég most az adatok leírása, amit a „show columns and coverage” linkre kattintva tekinthetsz meg (nem itt, hanem a SimFin felületén 😊).

És hát erről van szó. Választhatod te akár az API-k kapcsán is a kényelmes, egykattintásos megoldást, de kész „tálételt” kapsz. Mint itt. Olyan metrikákat, melyek amúgy teljesen rendben vannak, de a szolgáltatód (jelen esetben SimFin) saját ajánlása, gyakorlata, tapasztalata stb. alapján lettek összeválogatva.

Ám mi van, ha te mondjuk a Falcon Method lelkes követője vagy, ahol az EVA keretrendszer alapján más minőségi és növekedési karakterisztikákkal is dolgoznál? Na, itt már van egy dilemma. Mert most vagy az van, hogy kényelmesen megspórolod a data science tanulási részét a dolognak, és a szolgáltatódra (SimFin) hagyatkozol, de akkor lemondasz egy másik szolgáltató, illetve a saját gyakorlatod előnyeiről (most persze sarkítok). Vagy ragaszkodsz a saját gyakorlatodhoz (fentiektől eltérő metrikák), de akkor képesnek kell lenned arra, hogy „belenyúlj” az API-ba, vagy a folyamat későbbi részeinél leszel kénytelen minimális szinten adattudósként működni.

Vedd észre azt is, hogy hány különálló dataset (Companies, Income Statement, Balance Sheet stb.) letöltésére van lehetőséged, és egyben szükséged. Egy kicsit is gyakorlott elemzőnek ilyenkor már legalábbis rossz érzése támad: hogy lesz ebből egy elemezhető adategyüttes? Úgy van! Data science és Python alapok 😊. De emlékezz! Pont ez a bejegyzés mutatja meg, hogy az AI segítségével ez nem olyan ijesztő, mint ahogy elsőre hangzik.

Szóval térjünk is vissza a fenti letölthető adatokra! Az egyszerűség kedvéért most csak a legszükségesebb négyet (Companies, Income Statement, Balance Sheet, Cash Flow) szemeljük ki, és onnan is kezdjünk a Companies-zel:

Terjedelmi okokból most hadd ne menjünk bele, hogy melyik mit tartalmaz és miért kell. A bejegyzés a GenAI-támogatást demonstrálja, fókuszáljunk erre. Kattints tehát a Companies-en belül a Python Code gombra:

…éééés helyben is vagyunk (a saját API-kulcsomat kitakartam, ezért a fekete sáv):

Na, ez az a pont, ahol Tudatos KisBefektetőként egy útelágazáshoz érsz. Kétségbeesésedben dönthetsz úgy, hogy:

  1. Feladod, mert mégiscsak jó lesz neked a banki kamat is. (ejnye)
  2. Az AI-hoz fordulsz, majd az mindent megold (spoiler: nem jó ötlet, sok mindent nem old meg, vagy rosszul – egyelőre)
  3. A szolgáltató (legyen itt szó akár a részvénybefektetői döntéstámogatásról, vagy fintech adatszolgáltatódról) által kikövezett úton mész végig, de ekkor elfogadod, hogy a módszertani kockázattal futsz tovább.
  4. Kiképzed magad data science-ből is öt danos mesterré, ám ez sokaknak talán túlzás.
  5. Megtanulod a data science alapokat, és az AI-t okosan, eszközként használva megoldod a problémádat. (talán már érzed, hogy ezt fogom javasolni)

A bejegyzésben meghirdetettek szerint mi most a #2 pont alapján megyünk tovább, újra hangsúlyozva, hogy ez egy demo, és ezt az utat senkinek sem ajánlom követni!

Szóval a Perplexity Pro-hoz fordulsz, és promptolsz mondjuk egy olyat, hogy:

Jön is válasz:

A linkre kattintva töltsd le a Python Install Manager-t:

Menj a Downloads folderedbe, és kattints a fájlra, majd a felugró ablakban indítsd el az installálást!

Ha minden jól megy, felugrik a Windows terminál:

Érdemes ezt is értelmeztetni a Perplexity-vel (képernyőkivágat és feltöltés). Fontos! A te géped aktuális beállításainak, állapotának függvényében kaphatsz más üzeneteket. De ez most érdektelen, mert a folyamatot modellezzük csak.

Ugyanakkor itt az egyik fontos tanulság a GenAI-ról. Pont az az ereje (és egyben a veszélye is), hogy nem „determinisztikus algoritmus”. Azaz még akkor sem feltétlenül ugyanazt az outputot kapod, ha ugyanazt az inputot adod meg (mint egy klasszikus szoftvernél). Azonban ezért tud segíteni.

Tehát, ha a te géped, környezeted eltér az enyémtől, és nem azt látod, amit itt példaként megadok, akkor nem kell „lefagynod”, bátran fordulj a GenAI-hoz. Nem lehet eleget hangsúlyozni azonban, hogy ez csak akkor működik biztonságosan, ha ezt nem teljesen képzetlenül teszed ebben a témában. Különben nagyon könnyen a vak vezet világtalant helyzetbe kerülhetsz.

Folytatva a folyamatot, terjedelmi okokból nem másolom ide a teljes választ, csak a lényeget: a fenti parancssorban írd, hogy Y, majd Enter!

Azt, hogy mindent jól csináltál, a Windows (feltételezve, hogy ezt használsz) Settings / Apps menüjében tudod leellenőrizni:

Az alábbiaknak mind “ON” állásban kell lenniük:

Visszatérve a Windows terminálhoz, ezt látod:

Itt újra a Perplexity-hez fordulhatsz, ami elmagyarázza, hogy mi micsoda és mit írj be. A képen az első blokk az elérési útvonal hosszára vonatkozik, amire az AI a „y”-t javasolta, de nem gond most még, ha az „N”-t választod, mint én. A második blokk „y”, és a harmadik blokk is „y”.

Emlékeztető: egy folyamatot demonstrálunk, amit amúgy nem ajánlok használni, ezért hadd ne menjek bele részleteibe, hogy mit miért csinálunk. A cél megmutatni, hogy tisztán AI-használattal egyáltalán hogyan tudsz Python-környezetet felállítani, és abban kódokat futtatni.

Szóval kövessük ezt most vakon: írjuk be a legutolsó sorba is, hogy Y, és Enter:

Tátááám! Van egy Python-környezeted felinstallálva (a profi data science célokra még véletlenül sem a gépedre telepítenél Pythont, de ez másik blog témája lesz):

Az örömhírt megosztva a Perplexity-vel ezt kapod:

Ehhez: Windows billentyű + R:

Enter-t nyomva ezt kell kapjad:

A vonatkozó utaítás a Perplexity-től:

Előfordulhat, mint ahogy nálam is, hogy a kód a python szóval nem működik, hanem helyette:

py –version a helyes:

Ezt megosztva a Perplexity-vel jön is a reakció:

Most egy relatíve hosszabb futás következik, aminek csak a végét másolom ide:

Amit a „fogalmatlan vakrepülés” során érdemes lenne (ha ezt az utat javasolnám, de nem javaslom) tenned, hogy minden képernyőkép tartalmát visszaigazoltatod a GenAI-jal, hogy OK-e.

Itt azonban már felmerül egy nagyon fontos etikai, jogi és üzleti adatbiztonsági kérdés! SOHA ne ossz meg olyan tartalmat a GenAI-jal, ami érzékeny információt tartalmaz. Ennél a modellezésnél most könnyű dolgunk van, hiszen nincsen tétje. De éles helyzetekben mindig ellenőrizd és mérlegeld, hogy mit töltesz fel neki!

És akkor itt már érzed a sok ok közül az egyiket, ami miatt ezt az utat nem ajánlom. Ami miatt a megoldás az lesz, hogy megtanuld a data science alapokat. Ha ugyanis azok megvannak, akkor nem vakon dolgozol. Nem kell mindent visszaigazoláskérés okán feltöltened neki, hiszen érted, hogy mit csinálsz, és mit csinál ő (GenAI).

Most mindenesetre folytassuk ezt a „vakrepüléses” demót:

Tehát mit csináltunk (ne legyünk nagyképűek: mit csinált a GenAI 😉) eddig?

Telepítettük a Python-környezetet, és annak segítségével telepítettük a SimFin csomagot. Mi az a SimFin csomag? Olyan, mások által előre megírt Python-kódok gyűjteménye, ami tartalmaz mindent, hogy lehívhassuk az adatokat a SimFin-től.

Visszatérve a Perplexity folyamatlépésekhez:

Amit itt látsz, az az, amit fentebb a SimFin oldalán a „Companies” adat „Python Code” gombjára kattintva kaptunk. Vedd tehát észre, hogy a fenti 1–4 pontok a környezet kialakításának lépései voltak. Ezeket többé nem kell megismételned. Innentől kezdve a SimFin oldaláról mindig csak az 5. lépést kell adategyüttesenként megismételni. Nézzük tehát, mi a teendő az imént megnyitott Notepad fájllal a „Companies”-re nézve (az elérési útvpnalak nyilván a sajátjaid kell legyenek)!

Ilyesmit kell láss:

Ugyanezt a képernyőképet a GenAI-jal is megosztva, ezt kapod tőle:

…és tényleg:

Következő lépések? Ahogy fentebb említettem, a Companies (a részvénytársaságok) mellé a pénzügyi adatokat (Income Statement, Balance Sheet, Cash Flow) is le kell tölteni, de ez már rutin a fentiek után:

Innentől tehát a fenti 5. lépéstől kezdődően a következőkre (a, b, c) van csupán szükséged.

Gratulálok! A modellfeltételezés szerint az API-k és a Python világában teljesen fogalmatlanként, tisztán a GenAI segítségével olyat tettél, amiről a Tudatos KisBefektetők évtizedek óta csak álmodtak. Minőségi (hogy mennyire minőségi, azt nem tisztem megítélni, a SimFin saját állítása szerint az) pénzügyi adatokhoz jutottál (a demo esetében, mivel az ingyenes verziót használtuk, ez nem igaz, a teljes és naprakész adatokért itt is fizetni kell, de a célcsoport részére messze elérhető áron). És ez forradalmi előrelépés!

Azonban óriási veszélynek teszed ki magad, ha ebből arra a következtetésre jutsz, hogy a teljes elemzési folyamatot ezzel a módszerrel viszed végig. Azokon a szempontokon (adatbiztonság, jog, etika), melyeket fentebb már érintettem, vedd észre, hogy ebben az adatletöltési lépésben a Python-kódok lényegi részét a szolgáltató (SimFin) írta. Nem volt kérdés, hogy jó-e: ezt neked nem kellett képesnek lenned megítélni.

A tánc azonban még csak most kezdődik. Van több adattáblád (jelen esetben négy), ezekből egyet kell varázsolnod. Ha megnézed a letöltött fájlokat, azt látod, hogy az egyes évekre vonatkozóan egy adott részvénytársaság évente soronként ismétlődik. Ez nem a legkényelmesebb struktúrája az elemzésnek: célszerű cégenként egy sorra törekedni, tehát egy transzponálást is el kell végezned. Valahogy kezelned kell a hiányzó adatokat, majd mindenféle származtatott értékeket számoltatni stb., stb. Megannyi kódírási és futtatási feladat.

Ha ezt nem látod át, hanem vakon a GenAI-jal végezteted, akkor minden művelet egy „fekete doboz”: fogalmad nem lesz, hogy mi történik. És itt nem csak a kódolásról van szó, hanem egyéb elemzési (pl. statisztikai) ismeretekről is. Erre alapozni üzleti (pl. befektetési) döntéseket óriási szakmaiatlanság és felelőtlenség!

Ám a példa arra jó, hogy azért érzed: egy másik módon használva a GenAI-t, az nagy segítségedre lehet. Eljutunk ide is 😉.

A következő bejegyzésben újra végigmegyünk a folyamaton, de a SimFin saját útmutatója alapján. Ebben a modellfeltételezésben továbbra is fogalmatlanok vagyunk a Python és egyéb data science kérdésekben, de már nem egy „fekete doboz” GenAI vezet minket, hanem egy vélhetően felelős (számonkérhető) és kompetens emberi szakértelem (ebben az esetben a SimFin). Ez már nyilvánvalóan egy ajánlható út, ám már most vedd észre: legfeljebb az adatletöltésig segít rajtad (módszertani kockázat). Az elemzés ezt követő lépéseiben magadra vagy hagyva, tehát pillanatok alatt szembesülsz a data science és azon belül a Python-alapok ismeretének szükségességével.

Hamarosan visszatérek 😊

Vélemény, hozzászólás?

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük

További bejegyzések a témában

Tőkeallokátorok, stratégák, adatvezérelt döntéshozók – a kiemelkedő vezető III. rész

Az adatvezérelt döntéshozásról ma már minden cég beszél, de jóval kevesebben csinálják jól. Hárombetűs rövidítések (KPI, OKR, ERP, CRM) lepik el a prezentációkat, miközben a valódi kérdés az lenne: tényleg azt mérjük, ami a tulajdonosok számára értéket teremt? Vagy csak kipipáljuk az „adatvezéreltség” és a „digitalizáció” buzzwordjeit, miközben csendben égetjük a tőkét.

Tovább >>

Tőkeallokátorok, stratégák, adatvezérelt döntéshozók – a kiemelkedő vezető II. rész

Az adatvezérelt döntéstámogatás folyamatának egyik kritikus lépése a megfelelő metrikák megválasztása.
Tudtad, hogy a rosszul meghatározott KPI ok és ösztönzők alapján simán el lehet vezetni egy vállalatot hatalmas bónuszokért úgy, hogy valójában a menedzsment nem tesz le valódi hozzáadott értéket az asztalra?
Tudtad, hogy még ha a vezetés jóhiszemű és hozzáértő is, akkor is tud tulajdonosi értéket rombolni egyszerűen a rosszul megválasztott metrikák eredményeként?
Tudtad, hogy külön irodalma van annak, hogyan lehet a klasszikus számviteli mutatókat törvényes keretek között – akár akaratlanul, akár szándékosan – manipulálni a vezetés érdekében, a tulajdonosok rovására? Olvass tovább a részletekért!

Tovább >>