Introducing 

Prezi AI.

Your new presentation assistant.

Refine, enhance, and tailor your content, source relevant images, and edit visuals quicker than ever before.

Loading…
Transcript

Data Science a Richterben

Tóth Martin

A legkomplexebb és legfontosabb üzleti problémákra a megoldás egyre több esetben az adatokban rejlik.

Relevancia

Relevancia

Az üzleti szférára, a gazdaságra közvetlen hatást gyakorol az adatok exponenciálisan növekvő száma. Azok a cégek, amelyek a rendelkezésükre álló hatalmas mennyiségű adatot értékként kezelik, majd a feltárt információt hatékonyan fel tudják dolgozni, új ismeretekhez, tudáshoz jutnak, ami által versenyelőnyt szerezhetnek.

TUDÁSMENEDZSMENT

Data Science

"The world’s most valuable resource is no longer oil, but data"

Economist

A data science, vagy adattudomány egy koncepció, mely egyesíti a statisztikát, adatelemzést, és egyéb kapcsolódó területeket, annak érdekében, hogy adatokat felhasználva megértsünk ismeretlen, jelentős üzleti értékkel bíró jelenségeket.

Majdnem azonos, pár különbség.

Egyes terminológia szerint BI magában foglal mindent, tehát az a legkülső halmaz.

Data science a gyógyszeriparban

Novartis:

120.000 alkalmazott, 1200 elemző és data scientist

Adatbányászat

Az adatbányászat a nagy mennyiségű adatokban rejlő információk félautomatikus feltárása különféle algoritmusok alkalmazásával.

Kihívás a keletkező adat és információ szisztematikus tárolása és feldolgozása.

Big Data

Leegyszerűsítve a „Big data” mint fogalom, a nagyon nagy mennyiségű, nagyon nagy sebességgel változó, és nagyon változatos adatok feldolgozásáról szól.

Nagyon nagy mennyiség =

Valódi Big Data felhasználó:

pl: Google, Facebook

Richternek ez távlati cél.

Eszközök

  • Statisztikai módszerek
  • Vizualizáció
  • Algoritmusok
  • Mesterséges intelligencia

Eszközök

  • Adatvagyon

Gépi tanulás

Mesterséges Intelligencia (MI) egyik ága

Algoritmusok, melyek képesek önállóan, vagy emberi segítséggel összefüggéseket, szabályokat felismerni, meghatározni.

Felügyelt tanulás

A felügyelt tanulás folyamata során az algoritmust egy tanító adatkészlet segítségével "oktatjuk".

Algoritmusok tanítása példákon keresztül

algorimus - diák adatkészlet - tanár

  • Neurális háló
  • Döntési fa
  • Lináris regresszió
  • Logisztikus regresszió

Felügyelt tanulás

Klasszifikáció

Klasszifikáció alkalmazása során az adatpontokat két vagy több osztályba (jó/rossz kioldódás) soroljuk be, majd az algoritmus a tanítókészlet segítségével feltérképezi az összefüggéseket, mely alapján a jövőben képes lesz besorolni ismeretlen adatokat az előre meghatározott osztályokba.

Klasszifikáció

Elfogadható/nem elfogadható sarzsok (több szempontból) vizsgálata alapján a kritikus magyarázó változók felderítése

Regresszió

Regresszió használata során egy folytonos függő változó (pl kioldódás) kapcsolatát modellezzük egyéb független változókéval (pl kötőanyag hőmérséklete).

Regresszió

Mind lineáris, mind nemlineáris (döntési fa) kapcsolatok feltérképezésére alkalmas.

Felhasználás:

  • Eldönteni mely független változónak van ráhatása a függőre (pl kioldódás)
  • Predikciók extra/interpoláció segítségével

Például: Kioldódási problémákat mely okok magyarázzák (számszerűen), ebből pontosabb predikciót lehet készíteni, mint a klasszifikáció esetén.

Felügyelet nélküli tanulás

Rousseau pedagógiája

A felügyelet nélküli tanulás célja az adatok struktúrájának vagy eloszlásának modellezése, hogy ismereteket szerezzünk összefüggésekről, melyek sok esetben szemmel nem láthatóak.

A felügyelt tanulással ellentétben itt nincs "jó válasz" és nincs tanár. Az algoritmusok maguktól keresnek öszefüggéseket és próbálják stukturálni az adatokat.

Felügyelet nélküli tanulás

Klaszterezés

Rejtett struktúra az adathalmazban, hipotézis nélküli analitika.

Ajánló rendszer

Pl: Facebook hirdetések

ADATVAGYON

Hogyan, hol?

Hogyan, hol?

INFORMÁCIÓ

ERP rendszerek

Sarzs adatok

Szenzorok

Külső adat

TUDÁS

Vállalati kultúra

Adat értékként való kezelése

Nem elég a megfelelő embereket illetve partnereket alkalmazni, a vállalati kultúrába is be kell építeni a szemléletet: az alkalmazottaknak ismerniük kell a változások hátterét, hogy elfogadják az új technológiákat.

Digitalizáció:

  • LIMS rendszerek
  • Elektronikus sarzslap
  • OSI PI

"A gyógyszeripar a többi iparághoz képest általában lassabban reagál a technológiai változásokra, melyek segítségével csökkenthetnék a kiadásokat, és növelhetnék a bevételeket."

-Financial Times

Termelés

Több száz gép, több ezer szenzor, melyek másodpercenként gyűjtik az adatot (hőmérséklet, nyomás, levegőáramlás, stb…).

  • Folyamatok optimalizálása
  • Döntések támogatása bizonyítékokon alapuló információk segítségével.
  • Beruházások szükségességének előrejelzése
  • Prediktív karbantartás
  • Gépek alkatrészcseréjének előrejelzése

(tablettázó szerszámok, granuláló porzsák)

Proof of Concept

Megoldási javaslat: Glatt párásító egységének használata - legalább 7 g/m3 értékre állítása.

Megoldási javaslat: Kötőanyag készítés optimalizálása.

Probléma forrása a maradék etanoltartalom, vagy szezonális jelenségről van szó (páratartalom)?

Nehezen hozzáférhető archivált adatok miatt nincs előrelépés.

Kutatás-fejlesztés

  • Virtuális molekulamodellezés
  • adatok feldolgozása és értelmezése
  • Biológiai folyamatok prediktív modellezése
  • Turbine - tumorellenes szerek hatásának modellezése neurális háló segítségével
  • Betegek "átvilágítása"/szűrése klinikai vizsgálatokhoz
  • Klinikai tesztek monitorozása
  • kombinálva prediktív modellezéssel a gyors és megfelelő reagálás érdekében

Egyéb

Kereskedelem és marketing

  • Prediktív analitika - orvoslátogatók célzott elosztása

Logisztika - Supply chain managment

Szerializációból származó adatok felhasználása a GDPR szabályok figyelembe vételével

Mindenhol, ahol nagy mennyiségű adat található!

Jövőkép

Jövőkép

Ütemterv

Jelenleg "adatsilók" -> adattárház kialakítása

Adatelemző/BI/Data Science csoport létrehozása

Adat értékként kezelése

Adatvagyon létrehozása

  • Jelenleg "adatsilók" -> adattárház kialakítása
  • Kivizsgálások támogatása
  • Gyártási receptek optimalizálása
  • Automatizált prediktív modellek
  • Gyártás közben megjósolják, hogy milyen minőségű (kioldódás, selejtszám stb..) lesz az adott gyártási tétel.

Adatelemző/BI/Data Science csoport létrehozása

  • Adattárház kezelés
  • Statisztika, Machine learning, programozás - Data Science
  • Gyógyszerészet
  • Képzés/oktatás
  • Konferencia - Best practice
  • Folyamat kialakítása ad hoc elemzések helyett

MES - EBR

  • Elektronikus sarzslap
  • digitális feljegyzések -> adat!
  • Dokumentációs feladatok egyszerűsítése (PQR)
  • OSI PI

Módszertan - EFOP-3.6.2

  • Közös munka az SZTE-vel
  • Machine learning, Big Data ismeretek szerzése
  • Módszertan kidolgozása
  • Hangsúly a felügyelet nélküli tanulás alkalmazásán
  • Gyártások optimalizálása új összefüggések feltérképezésével

Köszönöm a figyelmet!

Learn more about creating dynamic, engaging presentations with Prezi