Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Big Data

Kreowanie wartosci z cyfrowego chaosu
by

Wojciech Kurowski

on 2 November 2017

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Big Data

listopad
grudzień
luty
październik
styczeń
Big Data
Natura inteligencji zawartej w sieci
Ekonomia Big Data oraz przegląd wybranych zastosowań biznesowych
Przez wiele lat mogliśmy liczyć na to, że efektywność działań będzie wzrastała wraz ze wzrostem organizacji w jednostajnym tempie. Kres owemu przyśpieszeniu kładą jednak ograniczenia fizyczne, ponieważ administracja, po osiągnięciu punktu optimum, wzrasta ponad liniowo w stosunku do efektywności procesu. Koszt oraz efektywność administracji staje się wtedy balastem w rozwoju. Organizacja zaczyna się „topić”, kiedy jej produkcja za szybko przyśpiesza. Taką samą sytuację rozpoznano w:
1) energetyce oraz 2) w produkcji komputerów. W obu przypadkach znaleziono rozwiązanie problemu – jest nią
równoległość
Cyfrowa dźwignia wzrostu wartości
Algorytm "dziel i zwyciężaj"
Projektując algorytm „dziel i rządź”, problem dzieli się
rekurencyjnie
na kilka
mniejszych podproblemów tego samego typu lub podobnych do początkowego
problemu (fraktale), a następnie rozwiązania wszystkich problemów są łączone w celu utworzenia rozwiązania całego problemu. W przeciwieństwie
do
algorytmu przez wstawianie
, metoda dziel i rządź scala poszczególne elementy. Pozwala również wykorzystać rekurencję (ang. recursion, łac. recurrere – przybiec z powrotem) przez wielokrotne wykorzystanie raz rozwiązanego problemu do rozwiązywania podobnych problemów, na wzór matematycznej metody odwoływania się funkcji lub definicji do samej siebie.
Cyberbezpieczeństwo
Właściwe wykorzystanie informacji może być kołem rozwoju gospodarki, a niewłaściwe – jej hamulcem
Studium przypadku dotyczące Big data
prezentacja prac zaliczeniowych
dr
Wojciech Kurowski
Instytut Zarządzania Wartoscią SGH
Zakład Akcjologii i Pomiaru Wartości

wwwkurowski@gmail.com
fb.com/wojciech.kurowski
tel. 506-521-182
http://www.wojciechkurowski.blogspot.com

2018
materiały do wykładu sa do pobrania na stronie
http://www.wojciechkurowski.blogspot.com

Charakterystyka Big Data
big data w modelu 4V:
duża ilość danych (ang. volume);
duża zmienność danych (ang. velocity);
duża różnorodność danych (ang. variety);
duża wartość (ang. value)
Mity i fakty zwiazane z Big Data
wielkość danych - czy potrzebne sa duże zasoby danych poddawanych przetwarzaniu?
koszty i granice - zdolność gromadzenia i przetwarzania dużych zbiorów danych oraz wyciągania z nich wniosków to rozwiązanie opłacalne jedynie dla dużych firm o globalnym zasiegu?
czy słusznie big data scientist, czyli badacz danych, to zawód uznawany już „za jedną z najseksowniejszych profesji XXI wieku”?
co jest/bedzie wazniejsze w Big Data - wiedza eksperska w analiznie danych czy kompetencje biznesowe?
data scientist a analityk danych.
Case study - LinkedIn

Jonathana Goldmana z LinkedIn kiedy zaczynał pracę w tej firmie w 2006 roku, na portalu zarejestrowanych było już 8 milionów kont. Niestety, użytkownicy serwisu nie szukali tam nowych znajomych ani nie budowali sieci swoich kontaktów. Któryś z menedżerów porównał to do sytuacji, w której ktoś przychodzi na konferencję, gdzie jest bardzo dużo gości, ale nie zna nikogo – można więc się spodziewać, że postoi chwilę sam pod ścianą i szybko wyjdzie do domu. Tego właśnie LinkedIn chciało uniknąć.
Goldmana (doktora fizyki) zaintrygowalo bogactwo informacji na profilach użytkowników LinkedIn i powiązania między nimi. Ogrom danych sprawiał wrażenie wielkiego bałaganu. Goldman zaczął jednak stawiać hipotezy, poddawać testom swoje przeczucia i szukać wzorów, których wykorzystanie mogłoby przynieść nową wartość dla klientów.
Dzieki potedze analityki i intuicji biznesowej skonstruowal on
moduł „podpowiadający”
użytkownikowi, kogo spośród innych osób na LinkedIn, może on z dużym prawdopodobieństwem znać i chcieć zaprosić do sieci swoich kontaktów. Moduł ten miał o 30% wyższą klikalność niż inne podpowiedzi w serwisie i wygenerował miliony dodatkowych odsłon.
Case study - E-commerce zasilane big data
Modul podpowiadajacy znany z aplikacji LinkedIn może dzialac niemal tak, jakbyśmy dyskutowali ze sprzedawcą w tradycyjnym sklepie: „Rozumiem, że pan się jeszcze zastanawia, ale mamy tutaj jeszcze coś specjalnego, wydaje mi się, że w sam raz na pana potrzeby i oczekiwania”.
Część klientów kupuje jeden produkt i wychodzi, ale dzięki inteligentnemu dialogowi w czasie rzeczywistym z tymi niezdecydowanymi rosną obroty sklepu, wzrasta liczba klientów powracających, wzrasta częstotliwość wizyt, wzrasta zadowolenie i liczba pozytywnych rekomendacji.
Big data to big money.

Najprostsza wersja analityki to wolumen i wartość sprzedaży w podziale na: produkt, liczba i średnia wartość transakcji itp. Bardziej dojrzałe sklepy analizują dane zakupowe bardziej szczegółowo, na przykład: czy klienci kupują więcej czy tyle samo, jak zmienia się wolumen i kupiony asortyment w czasie, ilu jest nowych klientów i co kupują, jakie są typowe koszyki zakupowe.
Przykladowe pytania budujące mechanizmy rekomendacyjne:
Ilu i jakich klientów porzuciło swoje koszyki?
Które produkty zostały wyjęte z koszyka i zastąpione innymi?
Czy zastępcy byli z tej samej kategorii czy z innej?
O ile zmniejszyła lub zwiększyła się wartość koszyka po takiej zmianie?
Czy dla tej grupy klientów jest jakaś wartość graniczna koszyka, przy której zaczynają optymalizować jego zawartość?
Czy gdyby klient dostał specjalny rabat, to kupiłby porzucony koszyk?Ile powinien wynieść taki rabat?
Jak długo klient szukał kolejnego produktu do koszyka? Ile odwiedził podstron, zanim znalazł to, czego szukał? Czy i jak długo przeglądał opisy produktów?

Cause study - Facebook
1,5 miliarda użytkowników Facebooka przekłada się na farmy danych na nasz temat, które przechowuje korporacja. Podstawowym celem śledzenia naszej aktywności jest stworzenie jak najbardziej dopasowanej do potrzeb reklamy
Co wie o nas Facebook i skąd zdobywa takie informacje?:
zainteresowania – kliknięcia przycisków Lubię to!,
hasła wpisywane do wyszukiwarek,
ustawiane lokalizacje,
Ruch kursora - podejrzewa się, że Facebook zczytuje również dane z kursora, czyli śledzi już nie tylko moment scrollowania przez nas strony głównej i czasu poświęconego na przyjrzenie się poszczególnym wiadomościom, ale sprawdza, gdzie poruszamy się myszką,
Nagrywanie nazego otoczenia.

Firmy, które zajmują się tworzeniem stron internetowych stosują również tzw. eye-tracking, czyli śledzenie ruchów źrenicy użytkownika. Firmy stosują rownież Brain-tracking, czyli odczytywanie emocji jakie towarzyszą ruchom kursora na ekranie.
O tym, co o nas wie Facebook, możemy również dowiedzieć się dzięki aplikacji
Apply Magic Sauce.
I tak Apply Magic Sauce wskaże: wiek, płeć psychiczną, 5 cech osobowości – sprecyzowane i określone procentowo, każda analizowana osobno: otwartość, skrupulatność, ekstrawersja, ugodowość, neurotyczność, poziom inteligencji, poziom zadowolenia z życia, preferencje seksualne, poglądy polityczne i religijne, wykształcenie kierunkowe, status związku.


Zaliczenie przedmiotu Big Data
temat pracy zaliczeniowej:

Big Data – cyfrowa dźwignia wartości w polskich przedsiębiorstwach

Badanie podsumowuje korzyści biznesowe wynikające z praktycznego zastosowania big data i wskazuje na potencjalne trudności w osiąganiu oczekiwanych efektów

Inteligencja sieci
terminal / interfejs - wartość
brak sieci – inteligencja ma charakter
statyczny
> można ją stosować tylko tam gdzie występuje -> jeśli do wykonania zadania potrzebne są różne rodzaje inteligencji, to wszystkie one muszą być skupione w jednym miejscu -> przykład: komputer
i
nteligencja terminala
– rdzeń, powtarzalność funkcji, np. oprogramowanie w komputerze, czy przepis prawny (bazują na tym dostawcy infrastruktury);
i
nteligencja interfejsu
– peryferia, zindywidualizowane czynności – miejsce podłączania się użytkowników, subsumcja w prawie (bazują na niej firmy zarabiające na kontaktach z klientem – np. Yahoo)
sieci odsuwają inteligencje terminala i interfejsu w przeciwległe kierunki -> inteligencja terminala wtapia się we wspólną infrastrukturę rdzenia sieci – fordyzm; interlig. interfejsu rozdziela się na wiele różnych form -> w zw. z tym, że wartość postępuje za inteligencją, obydwa krańce stają się najważniejszym źródłem zysków.

"Nie chodzi o to, aby robić wszystkie rzeczy we właściwy sposób. Chodzi przede wszystkim o to, aby robić właściwe rzeczy. "
P. Drucker
"Caartoo było dla mnie ważnym doświadczeniem i wiele mnie nauczyło – przede wszystkim tego, że w biznesie bardziej od perfekcjonizmu liczy się sprawność i szybkość działania.
Dążąc do idealnych rozwiązań zazwyczaj nie udaje nam się ich ukończyć lub wyprzedza nas konkurencja. Dokładnie tak było w przypadku caartoo – mówi Rafael Moucka, jeden z pomysłodawców caartoo.
Przykład caartoo pokazał mi, że w biznesach internetowych, technologicznych, otoczenie zmienia się w ekspresowym tempie, pojawia się konkurencja, rozwijają technologie. Nie można więc zbyt długo czekać - także jeśli projekt nie osiąga szybkiej zyskowności.
Dziś kieruję się zasadami Leszka Czarneckiego – inwestując w jakikolwiek pomysł staram się wkładać w niego minimum środków i działać bardzo dynamicznie, by jak najszybciej osiągnąć break event point."
A. Łopisiewicz, "Dlaczego sto polskich startupów upadło. Cz. 1 - wywiady" - mamstartup.pl
http://mamstartup.pl/porazka/8167/sprawdzilem-dlaczego-sto-polskich-startupow-upadlo-cz-1?utm_content=buffer8d973&utm_medium=social&utm_source=facebook.com&utm_campaign=buffer
"Jeszcze w 2008 roku miałem kilkadziesiąt gigabajtów plików MP3, kilka kartonów płyt z grami i dwa dyski przenośne na dokumenty i zdjęcia. Dziś muzykę dostarcza mi Spotify, filmy oglądam w sieci, a gry pobieram w postaci cyfrowej ze Steam (tudzież Xbox Store). Wszystkie archiwalne dokumenty i zdjęcia trzymam natomiast na dysku Google’a.
Tak się dzieje ze wszystkim i, co istotne, na coraz większą skalę. Oprogramowanie typu Adobe czy MS Office przestało już być „stacjonarne”. Wykupujemy abonament i w jego ramach otrzymujemy dostęp do pakietu programów, przestrzeni w chmurze i towarzyszących jej usług. Office’a kupimy jeszcze w tradycyjnej postaci, ale Adobe całkowicie już przeniosło się do chmury. A nie zapominajmy o istnieniu coraz większej liczbie aplikacji działających wyłącznie w przeglądarce jak chociażby Google Docs.
Dziś na PC dominuje Steam, a gry stały się usługą. Płacimy za kod dostępu do niej.
Więcej przykładów? Proszę bardzo. Muzyka? Spotify. Filmy? Netflix i YouTube. Zdjęcia? Flickr i Google Photos. Kwintesencją tego wszystkiego jest platforma Chrome OS, której fundament stanowi działanie w oparciu o chmurę i aplikacje webowe." - http://antyweb.pl/ulotnosc-i-niepewnosc-czyli-sami-krecimy-na-siebie-bat-na-przykladzie-onedrivea/ (Tomasz Popielarczyk 2015-11-04)

W poszukiwaniu wartości w sieciowym świecie
M. Sawhney, D. Parikh,
W poszukiwaniu wartości w sieciowym świecie
[w:] M. Porter,
Doskonalenie strategii
, Harvard Business Review, Helion, Gliwice 2006, s. 199-223 ( artykuł po raz pierwszy ukazał sie w Harvard Business Review w numerze ze stycznia 2001 roku).
IDC's Digital Universe Study (2012)
1)
zdolność do analizowania ogromnych ilości danych i braku konieczności ograniczania się do mniejszych zbiorów (wykorzystywanie
wszystkich
dostępnych danych zamiast ich małych części - wartość danych znika, gdy dane są mniejsze)

2)
gotowośc do zajmowania się nieuporządkowanymi danymi i nie przywiązania wagi do ich
dokładności

3)
rosnące znaczenie
korelacji
i zrezygnowaniem z pogoni za odkrywaniem nieuchwytnej
przyczynowości
.
Big Data a statystyka
„Sięganie po próbę losową w epoce big data przypomina chwytanie bata w erze samochodów”
V. Mayer-Schönberger, K. Cukier, Big Data. Rewolucja, która zmienia nasze myslenie, pracę i życie, MT Biznes, Warszawa 2014, s. 50.
Dane zapisane w formie analogowej w stosunku do cyfrowej: w 2000 –
¼
informacji była zapisana w formie cyfrowej, w 2007 już tylko
7
proc. Było zapisanych w formie analogowej (dokumenty, książki, wywołane fotografie), w 2013 r. tylko
2
proc. Informacji nie jest przechowywana w formie cyfrowej .

Szacuje się, ze w 2013 r. liczba danych zgromadzonych na świecie to ok. 1200 eksabajtów (miliard gigabajtów) – gdyby te dane zostały umieszczone w książkach, pokryłyby 52 warstwami powierzchnię USA, gdyby zapisać je na płytach CD i położyć jedna na drugiej, można by zbudowaćz nich 5 kolumn z Ziemii do Księżyca.
źródło:
V. Mayer-Schönberger, K. Cukier, Big Data. Rewolucja, która zmienia nasze myslenie, pracę i życie, MT Biznes, Warszawa 2014, s. 21
Big data a analiza danych – to jak analiza szybko przesuwających się klatek tworzących film do analizy nieruchomego zdjęcia. /firma Google - za pomocą analizy treści wyszukiwań - może prawie tak samo dobrze zidentyfikować obszar występowania grypy, jak robia to organy państwowe na podstawie oficjalnych danych zebranych od lekarzy, z tą róznica że Google robi to w czasie rzeczywistym o wiele szybciej niż te instytucje.
Analizowanie wszystkich danych związanymi z obsługiwanymi transakcjami (np.. firma Xoom) i wykrywanie nieuprawionego użycia np. kart kredytowych, wykrywania anomalii. Odstępstwa od normy da się najlepiej wykryć analizując wszystkie dana a nie tylko próbki. W związku z tym że transakcje kartami są realizowane niezwłocznie, analiza również powinna być przeprowadzana w czasie rzeczywistym.
Przykład: pojedyńcza transakcja nie wzbudza podejrzeń, ale członkowie grupy przestępczej tworza makro poprzez wiele takich transakcji – analiza poprzez próbkowanie może przeoczyć zjawisko gdy mikro staje się makrem – wykrywa tylko pojedyncze drzewo a nie cały las.

Przykład wykorzystujący big data (zalety w stosunku do próbkowania – statystyki pomiarów):
Obserwacja dużo większego spektrum danych zwalnia z konieczności zachowania dużej dokładności (dzięki mniejszej liczby błędów wynikających z próby losowej możemy zaakceptować większą liczbe błedów pomiaru) oraz pozwala zobaczyć detale…. Obrazowo przedstawia to analiza fotografii i filmu.
O ile zwykliśmy uważać, że osoba zajmująca się danymi powinna cechować się ponadprzeciętną uważnością i perfekcjonizmem, o tyle obecnie cechy takie mogą okazać się wręcz szkodliwe.
Nie chodzi o to, by te same rzeczy robić szybciej, więcej, lepiej, taniej, ale by zmienić sposób myslenia – np.: skierować nasze produkty i usługi w zupełnie innym niż dotychczas kierunku.
(np. od posiadania przedmiotów (płyty CD) w kierunku udostępniania doświadczeń (np. Spotify)).
Aby wygrywać, nie trzeba robić czegoś lepiej, ale trzeba zrobić to inaczej. Dlatego… nie jest najważniejsza koncentracja na technologii (IT doesnt meter;). Liczy się bardziej koncentracja na potrzebach, oczekiwaniach i zachowaniach ludzi.

W Big Data ważna jest odpowiedź co się dzieje a nie dla czego. Nie zawsze musimy znać przyczynę jakiegoś zjawiska, możemy po prostu pozwolić danym mówic za siebie. Dzięki danym możemy odnajdować powiązania, których istnienia nawet nie podejrzewaliśmy – np. sentment wypowiedzi z Twittera do przewidywania akcji spółek, temperatura silnika i jego wibracje może posłuzyc przewidywaniu kiedy się zepsuje.
Zadanie nr 1
Spółki z branży Big Data działające w Polsce,
produkty i uslugi wykorzystujące Big Data w kreowaniu wartości firmy
Analiza źródeł wzrostu wartości.
Równoległość
Enegia potencjalna Big Data
W przeciwieństwie do wartości rzeczy materialnych – jedzenia które zjadamy, swieczek które się wymaplaja, wartość danych nie zmniejsza się, gdy zostaną użyte a jest odwrotnie oraz jest możliwość
wielokrotnego
używania i do różnych zamierzeń.
Warunkiem możliwości uwolnienia się od zużywalności przez uzywanie jest
przekształcenia cyfrowe
(przejście od atomów do bitów ) – w liczbową skwantyfikowaną formę i danetyzacja
Uśpiona wartość danych
(dane wykorzystane tylko do jednego celu) – podobnie jak z energią…może się uaktywnić

przykłady:

Pośladki –
nacisk w fotelach samochodowych w 360 rożnych punktach i nadając poszczególnym pomiarom indeks od 0 do 156 – można przkształcić tyłki w dane, które z dokładnoscia 98 proc skutecznością rozróżnia poszczególne osoby. – technologia ta może posłużyć jako system antykradzieżowy samochodu, alert przeciw wypadkowy (np. kiedy kierowca jest zmęczony)
Przykład
Projekt googla książki – nie tylko zeskanowanie ale również poprzez użycie programów do optycznego rozpoznawania znaków, daje mozliwośc szukania po frazach – ten system również przyczynił się do wykrywania plagiatów;
https://books.google.com/ngrams/
https://books.google.com/ngrams/graph?content=causality%2C+correlation&year_start=1800&year_end=2000&corpus=15&smoothing=3&share=&direct_url=t1%3B%2Ccausality%3B%2Cc0%3B.t1%3B%2Ccorrelation%3B%2Cc0
Gogle Trends - ponowne użycie zwrot ów wpisanych w wyszukiwarkach (stare zapytania mogę mieć dużą wartość – też bank anglii wykorzystuje zapytania związane z nieruchomościami żeby przekonać się, czy ceny domów rosną czy maleją)
analizowanie tekstów tweetów i używanie ich jako wskaźników pomagających w inwestowaniu na giełdzie papierów wartościowych.
Fizycy mówia o energii potencjalnej, która istnieje w każdym obiekcie, ale może być uspiona. Energia piłki lezącej na szczycie wzgórza jest potencjalna aż do czasu, gdy zostanie uwolniona czyli kiedy piłka zostanie popchnięta i stoczy się w dół. Wtedy enegia potencjalna przekształci się w kinetyczną, ponieważ obiekty poruszające się oddziaływują na inne.
Ep = mgh
m - masa ciała
g - przyspieszenie grawitacyjne
h - wysokość, na jakiej znajduje się ciało mierzona względem przyjętego układu odniesienia

Sposoby na uwolnienie uśpionej wartości danych (energii potencjalnej)
Łączenie danych (jeden zbiór danych z innym – bywa że bardzo odmiennym) – mieszanie danych w nowy sposób (pierwowzór to „mushupy” na stronach internetowych),
Zmiana architektury danych – ponowne zaprojektowanie w taki sposób żeby dane mogły być wielokrotnie używane, przykład google street view – poboczne cele to: zapisywanie danych GPS – zwiększyło to dokładność map, przechwytywanie informacji w ramach otwartych sieci bezprzewodowych;
Projektowanie wartości z „danych resztkowych” – cyfrowego sladu jaki ludzie po sobie pozostawiają: np. jak długo przeglądają stronę, jak poruszają wskaźnikiem myszki, co piszą itp. – przykład: ranking w wyszukiwarce – firma wię czy użytkownik kliknął na na ósmy link na 1 stronie czy na pierwszy i algorytm poprawia kolejne wyniki wyszukiwania.
Zadanie 2
Kluczowe pytania dotycące rozwoju Big Data

Na podstawie co najmniej 3 raportów z lat 2014-2017 oraz książki BIG DATA - KENNETH CUKIER, VICTOR MAYER-SCHONBERGER

- jakie pytania na które te raporty odpowiadają
najbardziej Was zainteresowały i dlaczego?
Ekonomia klasyczna – środki produkcji: ziemia, praca i kapitał
W gospodarce cyfrowej dane zaczynają przypominać nowe surowce lub srodki produkcji
Danetyzacja - ile wart jest Facebook ?
Wycena FB to ponad 310 miliardów dolarów (kwiecień 2016, w 2014 - 183), cały Alphabet to poand 517 miliardów, a Microsoft to 431 miliardów dolarów. Liczący sobie 10 lat portal społecznościowy wart jest więcej niż Toyota, Coca-Cola, Citigroup czy AT&T. Absurd?
Rzeczywistość równoległa
Mechanizm działania rekurencji najłatwiej można zrozumieć na przykładzie
silni: rekurencyjny wzór na obliczenie n! zapisuje się w ten sposób:
n! = n(n – 1)!
Ze wzoru tego wynika, że aby obliczyć np. 4!, należy najpierw obliczyć 3!.
Ale żeby obliczyć 3!, trzeba obliczyć 2! itd. aż dojdziemy do 0!, które jak wiemy wynosi 1.
Sposób obliczenia 4! wygląda więc następująco:
4! = 4 × 3! = 4 × 3 × 2! = 4 × 3 × 2 × 1! = 4 × 2 × 1 × 0! = 4 × 3 × 2 × 1 × 1 = 24.

W treści funkcji silnia następuje wywołanie jej samej, ze zmienioną wartością parametru, co w połączeniu z warunkiem początkowym gwarantuje zakończenie obliczeń.
Model cyfrowego dyrygenta
Wraz z  pojawieniem się technologii informatycznych i  ich upowszechnieniem
każda współcześnie działająca organizacja może stać się organizacją równoległą
z zasobem dzielonym.
.Jedną z powszechnie stosowanych metod „programowania” biznesu z użyciem
układów „wieloprocesorowych” jest model dyrygenta. Polega na stosowaniu statycznej wielowątkowości (static threading), która odpowiada programistycznej abstrakcji „procesów wirtualnych”, współdzielących pamięć. Z każdym procesem jest związany inny układ decyzyjny i może on funkcjonować niezależnie od innych.
Dyrygent działa jak system operacyjny, ładuje proces do „procesora” (do swojej
organizacji) w celu jego wykonania i wywłaszcza z „procesora”. Tak się dzieje z kolejnym uruchomianym procesem.
Przykład dot. dyrygentów
zaplanowanie podróży z Warszawy do Meksyku
czynności:

1. Sprawdzenie terminów lotów do Meksyku – usługa oferowana przez porty
lotnicze w różnych miastach Polski. Wybór lotu, który umożliwia dotarcie do
celu na czas.
2. Usługa sprawdzenia dostępności miejsc w samolocie i rezerwacji biletu.
3. Płatność za bilet – usługa oferowana przez bank.
4. Sprawdzenie istniejących połączeń komunikacyjnych do wybranego portu
lotniczego – usługa oferowana przez kolej lub firmy przewozowe.
5. Wywołanie usługi rezerwacji biletu na wybrany środek transportu.
6. Dokonanie elektronicznej płatności za bilet.
7. Usługa lokalizacji hotelu znajdującego się w wybranej części Meksyku.
8. Usługa porównania cen i standardów w hotelach.
9. Rezerwacja noclegu – usługa oferowana przez wybrany hotel.
10. Usługa przeliczająca kursy walut w celu prezentacji całkowitych kosztów w wybranej walucie
Rodzaje dyrygentów

„dyrygent ręczny”
, czyli osoba fizyczna, która wykorzystuje usługi zewnętrzne przez samodzielne (ręczne) wykonanie powyższych punktów.

dyrygent automatyczny
” - aplikacja wyposażona w cechy sztucznej inteligencji, wykorzystująca koncepcję sieci semantycznej, sama wykonuje procesy, jeśli użytkownik właściwie wpisze parametry zapytania. Działa ona za pomocą inteligentnych agentów outsourcingowych (programowych), których zadaniem jest optymalny dobór oraz uruchamianie usług w celu realizacji zadania powierzonego im przez zleceniodawcę (użytkownika).
 „
cyfrowy dyrygent
”. - opiera się on na automatyzacji, która dotyczy nie tylko procesów (wchodzących w skład zaplanowania podróży), ale również „dyrygentów automatycznych”. Osoba chcąca jechać do Meksyku nie musi podawać żadnej specyfikacji. W tym przypadku sztuczna inteligencja „cyfrowego dyrygenta” wykryje zarówno specyfikacje, jak i samą chęć i przyczynę wyjazdu i natychmiast przedstawią dopasowaną ofertę.

Jest to ciąg liczb naturalnych określonych rekurencyjnie (definiujący
sam siebie). Pierwszy wyraz w tym ciągu to 0, drugi – 1, a każdy następny jest
sumą dwóch poprzednich, co przedstawiają poniższe przykłady:
1 + 1 = 2; 1 + 2 = 3; 2 + 3 = 5; 3 + 5 = 8; 5 + 8 = 13; 8 + 13 = 21; 13 + 21 = 34; 21
+ 34 = 55; 34 + 55 = 89; 89 + 144 = 233; 144 + 233 = 377; do nieskończoności;
Efekt ciągu Fibonacciego w Big Data
„Śmierć jest tylko dla tych, którzy nigdy nie żyli, którzy zostali martwi przez całe swoje życie” (…) możesz odejść, ale sposób w jaki żyłeś będzie tworzył własne wibracje (z filmu Matrix)
Marcin Winkler (Head of Internet Marketing w P4 (Play)), mówiąc o tym, co jego zdaniem we wdrożeniach big data zasługuje na największą uwagę, skupił się na przykładach zagranicznych. Przywołał przykład izraelskiej firmy Nemesyco, proponującej rozwiązanie do oceny ryzyka nadużyć na podstawie analizy spektralnej głosu. Człowieka rozmawiającego z call center nie ocenia się przy użyciu tradycyjnego modelu screeningowego: jaką ma pracę, ile zarabia, czy ma samochód, ile ma dzieci. Nowy izraelski system analizuje za to, w jaki sposób dana osoba moduluje głos w odpowiedzi na różne pytania. Przez porównanie tych analiz z danymi na temat innych zachowań ludzkich w podobnych sytuacjach (big data) określa, czy człowiek nie jest potencjalnym oszustem.

żródło: http://www.ican.pl/pdf/152_SS_Teradata-zapis-z-debaty.pdf
Grupa:
Lider: Przemysław Knaś
Lider: Anna Kamińska

What’s the Big Deal with Data?
”- raport opublikowany przez BSA | The Software Alliance.
4listopada 2015 r.
Profilowanie a ochrona danych osobowych
- Niejednokrotnie dane na nasz temat pozyskiwane są nie bezpośrednio od nas, lecz z innych źródeł, bez naszej wiedzy i zgody.
Na podstawie łączenia często pozornie nieistotnych danych i analizy ich wzajemnych powiązań można pozyskać lub zidentyfikować nowe kategorie danych osobowych, a nawet tworzyć kompleksowe
profile
poszczególnych osób.Często na ich podstawie wyciągane są wnioski, co do naszych cech, zdrowia oraz możliwych zachowań.
W tym kontekście szczególnie interesująca jest automatyzacja tego procesu oraz stosowanie analiz predykcyjnych, czyli przewidywanie zachowań.

ochrona prawna:
ustawa inwigilacyjna (nowelizacja ustawa o Policji)
unijna reforma ochrony danych
Generalny Inspekor Ochrony Danych Osobowych (GIODO)
Ochrona danych osobowych w dobie Big Data
Ślady cyfrowe i kradzież tożsamosci
Internet - jest dużo informacji o zachowaniu ludzi - ich przemieszczaniu, preferencjach, aktywności, oglądanych stronach. To źródło danych, które mogą być przetwarzane w celu pozyskania wiedzy o typowych zachowaniach użytkowników, a także w określonych sytuacjach mogą umożliwić identyfikację konkretnej osoby,
nieustanne monitorowanie choćby poprzez inteligentne mierniki elektryczne, które w krótkich odstępach czasu przesyłają dane do centrali, śledząc każdą aktywność w domu,

Wiele danych jest tanio dostępnych, łatwo dostępnych i nie do końca zabezpieczonych
Bazami danych nie można się swobodnie dzielić z innymi podmiotami czy swobodnie ich zestawiać. Przetwarzanie w wielkich bazach musi mieć podstawy prawne, ważny jest jego cel. Danych, bez odpowiednich podstaw prawnych, nie wolno wykorzystywać do celów innych niż pierwotne.
Ze styczniowego (2016) sondażu TNS Polska wynika, że ponad połowa Polaków (55 proc.) uważa, że dane osobowe w Polsce są źle chronione. Przeciwnego zdania jest co trzeci badany (34 proc.). Co dziewiąty (11 proc.) nie ma na ten temat sprecyzowanej opinii.
14-04-2016 Parlament Europejski przegłosował nową dyrektywę regulującą kwestie ochrony danych osobowych na terenie Unii. Oznacza to, że wszystkie państwa członkowskie są zobligowane wprowadzić regulacje prawne zgodnie z wytycznymi UE.
Paragrafy zwiazane z Big Data:
Te przedsiębiorstwa, które przetwarzają dużą ilość danych, np. prowadzą badania konsumenckie, będą musiały utworzyć wakaty dla specjalistów odpowiedzialnych za ochronę danych osobowych.
Danych użytkownika nie będzie można przetwarzać dopóki, dopóty nie wyrazi na to wyraźnej zgody. Obecnie powszechną praktyką jest, że w internecie automatycznie są zaznaczone pola z wyrażeniem zgody na przetwarzanie danych osobowych. Unijne przepisy położą kres temu procederowi, ponieważ tego typu działanie stanie się niezgodne z prawem. Przepisy upraszczają także procedury związane z wycofaniem zgody na przetwarzanie danych osobowych.
Rozszerzono m.in. ich prawo do bycia zapomnianym. Każdy będzie mógł zażądać usunięcia swoich danych osobowych z konkretnego serwisu lub poprosić o ich przeniesienie w inne miejsce, jeżeli nie wystąpią wyraźne przesłanki za tym, żeby przechowywać dane.
Nowe prawo zastąpi przepisy z 1995 roku.
Technologia profilowania może więc stanowić poważną ingerencję w sferę życia prywatnego. Stąd tak ważne jest, aby każda osoba była poinformowana i świadoma konsekwencji profilowania.

Przykładowo, aby klient wiedział, że przystąpienie do programu lojalnościowego sieci handlowej wiąże się z wyrażeniem zgody na zbieranie i przetwarzanie informacji o preferencjach zakupowych, na podstawie których może mu zostać zaprezentowana specjalna, spersonalizowana oferta.

Możliwe są też negatywne implikacje profilowania – np. firma ubezpieczeniowa na podstawie tych samych danych z programu lojalnościowego sieci handlowej - o dokonywanych zakupach - stwierdzi, że ubezpieczony prowadzi niezdrowy tryb życia i podwyższy składkę ubezpieczeniową.
Profilowanie
Jak się bronić przed podglądaniem przez policję i służby, z racji ustawy inwigilacyjnej
Rady wg. portalu niebezpiecznik.pl
https://niebezpiecznik.pl/post/ustawa-inwigilacyjna-jak-sie-bronic-przed-podgladaniem-przez-policje-i-sluzby/

Szyfruj wszystko. Zawsze
(Służby mogą przechwytywać nie tylko ruch internetowy, ale i telefoniczny).
Edukuj swoich znajomych
. Twoja prywatność i poufność twoich rozmów nie zależy tylko od Ciebie. Nawet jeśli służbom nie uda się odczytać informacji z Twojego świetnie zabezpieczonego i zaszyfrowanego sprzętu, często będą w stanie pozyskać je od osoby z którą rozmawiałeś.
Zamień rozmowy telefoniczne i SMS-y na komunikację przez aplikację
Signal
, bo służby z łatwością mogą podsłuchać twoją rozmowę przez telefon i czytać twoje SMS-y.
Korzystaj z
VPN-a lub sieci Tor
, bo służby z łatwością i w czasie rzeczywistym mogą mogą podsłuchiwać twój ruch internetowy.
chroń swoją
skrzynkę pocztową
— służby mogą otrzymać jej zawartość od dostawcy BEZ twojej wiedzy.
nie trzymaj poczty u polskich usługodawców.
zakładaj osobną skrzynkę (niekoniecznie z Twoim nazwiskiem) dla danego zadania
zabezpiecz swoją s
ieć domową i urządzenia
,
Zostaw
smartphona
w domu, ale NIE WYŁĄCZAJ go
Nie korzystaj z
karty płatniczej
.
Nie korzystaj ze swojego
samochodu (ani taksówki)
.
Drugi wiek maszyn i nowe zagrożenia
Powstaje świat ktory rzadzi sie innymi regulami gospodarczymi - w ktorym miejsce niedoboru zajmuje nadmiar, dobra cyfrowe roznia sie od tych fizycznych i ta roznica ma istotne znaczenie.
Swiat staje sie hybrydowy (dobra fizyczne i dobra cyfrowe). Postep techniczny dokonuje się w tempie wykładniczym
Co zagielo krzywa historii ludzkosci ?
Historia ludzkosci
wielkie dokonania - wydarzenie badz osiagniecie, ktore w istotnym stopniu zmienilo rzeczywistosć człowieka, zagielo krzywą ludzkiej historii:
60 tys. lat temu homo sapiens posiadajacy zdolnosc komunikowania sie, opuscil afryke i zaczal sie rozprzestrzeniac,
25 tys. p.n.e - homo sapiens - zmiotl z powierzni ziemi neardelczykow, (zaczeka sie epoka lodowcowa, 14 tys lat p.n.e - klimat sie zaczal wyraznie ocieplac)
Udomowienie zwierząt do pracy - konie 8 tys p.n.e, woly - hodowanie i zaprzegania do plugow - 6 tys. Lat p.n.e. - rozwoj rolnictwa (wczesniej zbieractwo) powstanie osad ludzkich i miast. Miasta staly sie dogodnym celem do lupiezy i podbojow.
Powstanie wielkich imperiow (wskutek wojen i podbojow) - imperia Mongołów, Rzymian, Arabów i Osmanów) - handel, zwyczaje
wielcy filozofowie ( budda, konfucjusz, sokrates - zyli miej wiecej w tym samym czasie, ) wielkie religie -hinduizm, judaizm, chrzescijaństwo, islam, buddyzm
powstanie pisma (3200 p.n.e.) i symboli ulatwiajacych prowadzenie rachunków (przez dlugi okres nie znano zera, wspolczesny system numeryczny, zwany arabskim, powstal ok 830 r. naszej ery)
demokracja - ok 500 r p.n.e. (powstała w Grecji)
1492 Krzysztof Kolumb odkryl Ameryke
silnik parowy - druga polowa XVIII wieku, (James Watt), fabryki i produkcja masowa
1982 - Times oglosil komputer "maszyną roku" - poczatek ery cyfrowej - przeistoczenia w bity, ktore moga byc przesylane za pośrednictwem sieci
Model Morrisa
Ian Morris, Why the West Rules - For Now: The Paerns of History, and What They About the Future, Farrar, Straus and Giroux, New York 2010.
wydajność energetyczna
- ilość kalorii na osobę, która udaje się pozyskać ze środowiska na potrzeby odżywania się, zapewnienia schronienia, handlu, przemysłu, rolnictwa czy transportu,
organizacja
- rozmiary największego miasta,
możliwości wojskowe
- liczebność, siła i szybkość rażenia br, kompetencje logistyczne itp.,
technologia inforacyjna
- stopień zaawansowania dostepnych narzędzi służących do przekazywania i przetwarzania informacji oraz zakres ich wykorzystania.
Rewolucja przemyslowa - uwolnienie od ograniczeń
siły mięśni
(
para
) - epoka maszyn

Druga epoka technologiczna - zwiekszenie mozliwosci
wykorzystania umyslu
(kompetencji intelektualnych) - (
sieć i Algorytmy
)
Komputery dignozuja choroby, sluchają nas i do nas mówią, a dodatkowo piszą wysokiej klasy prozę, roboty kreca sie po magazynach i autonomicznie prowadzą samochody...świat zaczyna do złudzenia prypominać dzieło
science fiction
.
Negatywne konsekwencji - w rewolucji przemyslowej byl to symbolicznie kłęby sadzy nad Londynem i ciężka praca wielu dzieci.
Negatywne konsekwencje drugiej epoki maszyn....?
Według Billa Gatesa sztuczna inteligencja (SI) stanie się w końcu zagrożeniem. Najpierw maszyny zaczną wykonywać część naszej pracy i jeśli się dobrze to rozegramy, to czerpać będziemy z tego korzyści. – Kilkadziesiąt lat później inteligencja będzie na tyle mocno rozwinięta, by stanowić zagrożenie – napisał. Tym samym dołączył do obozu „ważnych osób sceptycznie nastawionych do rozwoju SI”. Oprócz niego znaleźć można tam Stephena Hawkinga czy Elona Muska.

Gates, Musk* i Hawking boją się, że jeśli uda nam się stworzyć autonomiczną Sztuczną Inteligencję, będzie ona potrafiła stale się udoskonalać. Nie tylko przewyższy poziom człowieka, ale osiągnie poziomy niewyobrażalnego rozwoju. Stanie się Superinteligencją, której motywów nie będziemy mogli pojąć.
*Elon Musk ( założyciel koncernu Tesla i Space X) – razem z m.in założycielem Facebooka Markiem Zuckerbergiem i aktorem Ashtonem Kutcherem – inwestuje pieniądze w firmę Vicarious stawiająca sobie za zadanie stworzenia komputera myślącego jak człowiek i używającego połączeń neuronowych do przekazywania impulsów do kontrolowania ciała i mowy.

Idą nowe czasy
W połowie kwietnia wartość rynkowa
CD Projektu
zatrudniającego ponad
250
grafików komputerowych wyniosła niespełna
2,5 mld zł
, a kapitalizacja JSW, miejsca pracy dla ponad
19 tysięcy
pracujących pod ziemia, nieco ponad
1,8 mld zł
. Przychody CD Projektu były w 2015 nieznacznie niższe od
0,8 mld
, za JSW wyniosły az
6,9 mld
zł. CD Projekt zanotował
zysk netto 342,4 mln
zł, górnicza spółka wykazała
stratę netto
na poziomie
3164,7 mln zł.
podstawą nie jest już siła mięśni wspomaganych maszynami, ale siła umysłu
egzamin poprawkowy:
pytania z tematyki poruszanej na wykładach,
pytania praktyczne - np.: rozwiązania open source wspierające Big Data ( Hadoop, R), budowanie modelu nieliniowego, mieszanego i lift charts (od czego zależy budowa modelów i jak jego zbudować na zbiorze z wieloma variables).
W linku poniżej Zadanie 4 z przedmiotu Big Data (w prezi), przygotowane przeze grupę w składzie:
1. Natalia Malicka - Leader,
2. Olga Andrzejczak,
3. Agnieszka Dybała,
4. Michał Osak,
5. Karol Szerszeń.

http://prezi.com/_kuu8-bptsjp/?utm_campaign=share&utm_medium=copy
https://www.pracuj.pl/praca/head-of-big-data-business-intelligence-warszawa,oferta,4743241
Big data - w stronę sztucznej inteligencji
W planach jest powołanie organizacji pozarządowej, której celem będzie pogłębianie wiedzy na temat technologii związanych ze sztuczną inteligencją. Dla realizacji tego celu we wrześniu 2016 r. swoje siły połączyło pięciu gigantów branży technologicznej: Microsoft, Amazon.com Inc., oddział Alphabet – Google, Facebook Inc. oraz IBM.
przykład ostatnich strategiznych decyzji Microsoftu:

nowy dział, który będzie zajmował się badaniami nad sztuczną inteligencją - Microsoft AI and Research Gropu
przejęcie LinkedIn Corp. (koncern kupił tę firmę za 26,2 mld dol.) będzie szansą na przyspieszenie prac w sektorach analiz, samouczących się systemów i sztucznej inteligencji,
kupno firmy umożliwiające budowanie pozycji w branży sztucznej inteligencji, w
lutym 2016 przejęcie SwiftKey – producenta aplikacji samouczących się klawiatur
sierpnień 2016 wejscie w posiadanie moduł sztucznej inteligencji do planowania biznesowego pod nazwą Genee.
Zmiany w metodach analizy danych
możemy analizować dużo więcej danych, w niektórych przypadkach mozemy przetwarzać
wszystkie
dane dotyczące jakiegoś zjawiska
wcześniej (w erze analogowej) recepta na wielkie zbiory danych była
próba losowa
- obserwowanie duzo większego spektrum danych zwalnia z zachowania
dużej dokładności -
wraz ze wzrostem skali rosnie liczba niedokładności - np.: utarg w sklepie a PKB (poznawanie ogólnego kierunku rozwoju a nie każdego jego centymetra, grosza czy atomu)
odejscie od poszukiwania przyczyn - zamiast tego odkrywanie schematów i korelacji - co się dzieje a nie "dlaczego" (nie musza one ujawniać dlaczego coś się dzieje - przykład medycyna i przewidywanie chorób)
Większość stwonych instytucji powstała przy założeniu, że podejmujemy decyzje na podstawie małej liczby dokładnych informacji opisujących zjawiska, których przyczyne jesteśmy w stanie poznać.

Sytuacja zmieniła się, gdy zbiory danych stały się ogromne, moga być szybko przetworzone i są odporne na niedokładności.

przykład problemu - prewencyjne aresztowanie na podstawie prognozy popełnienia przestępstwa (inne: przwidzenie stanu zdrowia - wieksza składka ubezpieczeniowa)
Intuicja vs algorytmy
Oprogramowanie "zjada świat"
Wypieranie przez algorytmy tradycyjnych firm stało się możliwe dzięki:
połączeniom szerokopasmowym i mobilnemu dostępowi do Internetu,
darmowym narzędziom oprogramowania (niski próg dostępu)
infrastrukturze dostępnej na żądanie (możliwość szybkiego i taniego rozwoju).
konsekwencje:
Skype zaburzył rynek telekomunikacji, Netfix - rynek wypożyczania filmów, Spotify - rynek muzyczny itp,
Efektem ubocznym tego zjawiska jest fakt, że podczas naszej interreakcji z tymi cyfrowymi systemami zostawiamy mnóstwo istotnych danych na temat naszych zachowań.
Każdy z nas jest obecnie chodzącym generatorem danych
Wg. Erica Schmidta (od 2011 prezes Googla), w okresie od powstania cywilizacji do 2003 r. stworzono 5 eksabajtów danych. W 2013 r. taka liczba wytwarzana była co 2 dni (obecnie liczba danych biznesowych podwaja się co 1,2 roku).
Ceny pamięci: dyskowej (HD), półprzewodnikowej(SSD) i taśmowej (LTO). Dane za John M. McCallum (HD) - http://www.jcmit.com/diskprice.htm i z różnych żródeł sieciowych.
Internet access and broadband internet connections of households, EU-28, 2007–14 (% of all households)
The Hottest Startup Sectors In 2016
http://tomtunguz.com/hottest-startup-sectors-2016/
Chmura Microsoftu rośnie w bardzo zadowalającym tempie. Firma z Redmond jest dzisiaj chyba największym konkurentem dla Amazona na tym polu, przychody działu Intelligent Cloud wyniosły w ostatnim kwartale 6,7 mld dolarów, a to oznacza poprawę o 8% w porównaniu do analogicznego okresu roku poprzedniego. Kolejny raz spore wrażenie robią wyniki Azure: przychody wzrosły tu aż o 116%
Ile warta jest polska gospodarka? Trochę więcej niż Facebook, ale mniej od Microsoftu
1,7 biliona złotych, a w przeliczeniu 430 mld dolarów. Tyle jest warta cała nasza gospodarka według wyliczeń money.pl.
Gdyby potraktować Polskę jako firmę, to porównując ze światowymi koncernami i ich wyceną giełdową dawałoby to nam w sumie czwarte miejsce na świecie, po Apple, Alphabecie (Google) i Microsofcie. Pocieszeniem jest, że wyprzedzamy Amazona i Facebooka, choć... pewnie już niedługo.
Programistyczna aktywność człowieka i jej reakcja łańcuchowa
hipoteza symulowanej rzeczywistości
prof. Nick Bostrom, filozofa z Uniwersytetu Oksfordzkiego, doszedł on do wniosku, że istnieje znaczące prawdopodobieństwo, że żyjemy w symulacji.
Bank of America – BoA – jest jedenastą największą firmą świata na liście „Forbesa” Global 2000 i jednym z najważniejszych graczy na rynku finansowym. To instytucja ze wszech miar poważna, toteż niemałą konsternację wywołała jej wrześniowa (2016) notatka, którą wysłała do klientów. Analitycy banku określili prawdopodobieństwo, że żyjemy w czymś zbliżonym do filmowego Matriksa, na 20-50 proc. Swoją tezę poparli opiniami filozofów, naukowców i innych myślicieli.
Jeśli uwierzyliśmy, że rozwój technologii umożliwi nam w przyszłości stworzenie własnej symulacji rzeczywistości, to dlaczego sami nie mielibyśmy być już przedmiotem takiej symulacji? - Rzeczywistości, w której nasza codzienność jest złudzeniem stworzonym przez maszyny na wzór wizji Wachowskich (film Matrix) ludzie stworzyli sztuczną inteligencję, która zdobyła nad nimi kontrolę.
Czy obecnie maszyny są przedużeniem ludzkich zmysłów? A może jest na odwrót: ludzie stają się zmysłowym przedłużeniem maszyny?
W środku nocy kurs najstarszej pary walutowej świata – GBP/USD – uległ nagłemu i bliżej niewyjaśnionemu załamaniu. Skutek jest taki, że w piątek rano notowania brytyjskiego funta znalazły się na najniższym poziomie od roku 1985.
Hakerzy włamali się na konto agencji i puścili w świat plotkę, ceny akcji sapadły - indeks S&P stracił 0,95%, po 3 nutach natychmiast odrobiły straty. Ale chwilowo wartość amerykańskich spółek spadła o 136 mld dolarów16. To tak jakby kursy wszystkich polskich spółek notowanych w Warszawie spadły prawie do zera
kwiecień 2016
Zatoka Alaska

Brązowa woda o dużej gęstości pochodzi ze strumieni i rzek spływających z lodowców. Niebieska woda to otwarty Ocean Spokojny.
"Tak oto młody marynarz, który pływa po omacku do czasu, zanim pokieruje go światło doświadczenia, (...) tutaj przekona się od razu, że za przewodnika ma doświadczenie tysięcy nawigatorów"
Charles Lee Lewis, Matthew Fontaine Maury: The Pathfinder of he Seas, U.S> Naval Institute, 1927, s. xxii, vi. (cyt. za Matthew Maury, The Physical Geography of the Sea -korelacje na podstawie 1,2 mln pojedynczych danych z dzienników pokładowych i systemu wymiany informacji - na podstawie tych danych w pozniejszym okresie opracowanosystem szlaków żeglugowych, który jest uzywany do dziś.
Korzenie Big Data
mają swoje źródło w kontynuacjitarożytnych dążeń człowieka do mierzenia, zapisywania i analizowania świata (np. prace Euklidesa, który wyjaśniają zasady geometrii - praca "Elementy" autorstwa Euklidesa z Aleksandrii (325–265 r. p.n.e.), która była najważniejszym podręcznikiem matematycznym przez dwa tysiące lat.
Algorytmy - klucz do postępu
Gutenberg w roku
MCDXLVIII
- odkrył sposób drukowania książek polegający na łączeniu ze sobą ruchomych metaolowych części ) = powszechność użycia umiejętności pisania i czytania sprawiławolnienie myśli ludzkiej, koniec średniowiecza i czas rewolucji przemysłowej
W 600 r n.e. wynalaeziono w Indiach system dziesiętny (10 symboli i nawet olbrzimie liczby mogły być zaspisane), w IX w. rozpropagowała go książka o metodach dodawania, mnozenia, dzielania, obliczania pierwiasków kwadratowych, mieszkającego w Bagdadzie astronoma i matematyka = Muhammad ibn Musa al-Chuwarizmi.
Przedstawione schematy były
algorytmami
- były dokładne, jednoznaczne, mechaniczne, efektywne, poprawne.
Jego prace pozwoliły też wprowadzić i wyjaśnić pojęcia zera, ułamków oraz funkcje trygonometryczne sinus i tangens. Jako pierwszy ułożył tablice funkcji sinus i tangens, wprowadził elementy algebry. Termin algebra pochodzi z tytułu jego dzieła Al-kitab al-muchtasar fi hisab al-dżabr wa-al-mukabala (Zasady redukcji i przenoszenia)[1], zaś algorytm od zniekształconej wersji jego nazwiska.

Od tej pory system dziesiętny oraz algorytmy numeryczne odegrały ogromną rolę w cywilizacji, całkowicie zmieniając świat. Umożliwiły rozwój nauki i technologii, przemyłu i handlu, a póżniej w rozwoju oprogramowania.
Zadanie 3
Analiza hipotezy Nick Bostroma:
Czy żyjemy w symulacji komputerowej?
z perspektywy big data oraz jej implikacje w cyberprzestępczości.
Big Data - rozwój czy zagrożenia prywatności ?
Prognozy futurologów
Ray Kurzweil:
człowiek i maszyna staną się jednym
- będą jeszcze szybsze, bardziej wydaje, niezawodne i w końcu znacznie bardziej inteligentne niż ludzie,

Amy Webb:
maszyny będą też kreatywne
- przejmą również dziedzinę uważaną przez wielu za niezagrożoną automatyzacją (będą projektować). Za 30 lat jej zdaniem to komputery
będą za nas interpretowały świat
. To one będą dostarczać nam wyselekcjonowanych i spersonalizowanych informacji.

Kevin Kelly:
sztuczna inteligencja jak prąd
. Futurolog przewiduje, że będziemy kupować sztuczną inteligencję w "jednostkach" IQ, od usługodawców, tak jak dziś kupujemy np. prąd. Posiadanie SI nie będzie, według niego, niczym wyjątkowym, a ważne będzie to, do czego będziemy ją wykorzystywać.

Zadanie 4

zadanie indywidualne (NIE w grupach) - tylko dla osób, które nie złożyły jednego ze wczesniejszych zadań
Big Data - rozwój czy zagrożenia prywatności
Cyberbezpieczeństwo - statystyki
wraz z opracowaniem infografiki dotyczącej cyberbezpieczeństwa i big data
(w oparciu o najnowsze raporty i wyniki badań)
kwiecień 2016 - IBM X-force poinformował, że polskie banki zostały zaatakowane przez złośliwe oprogramowanie - GozNym. To najszerzej zakrojony tego typu atak w Polsce - zaatakowano 17 banków komercyjnych oraz - 230 banków spółdzielczych.
Malware zainstalowany na komputerze ofiary nie dopuszcza w ogóle klienta do połączenia się ze stroną bankowości elektronicznej. W zamian przekierowuje ofiarę na fałszywą, ale wyglądającą identycznie jak prawdziwa stronę banku, gdzie ofiara wpisuje swoje dane logowania i zdradza je tym samym przestępcom.
"Oczekujmy kolejnych fal ataku, bowiem grupa może wynająć istniejącą już infrastrukturę innym cyberprzestępcom. Każdy nastolatek będzie mógł przy pomocy waluty bitcoin wynająć infrastrukturę do ataku na polskie banki" - ostrzega ekspert IBM.

maj 2016 - W ręce rosyjskiego hakera trafiły dane dostępowe do ponad 272 milionów skrzynek mailowych (Przestępca mógł zdobyć informacje nawet o 57 mln osób). Wśród poszkodowanych mogą zaleźć się użytkownicy Gmaila, Hotmaila i Yahoo. Przestępca planował sprzedać skradzioną bazę za 50 rubli, czyli niecałe 3 złote.


Cyberbezpieczeństwo w 2016 r.
przykłady problemów
Data Science in Practice
Data Science in Practice jest inicjatywą Instytutu Zarządzania Wartością, stworzoną i kierowaną przez dr. Wojciecha Kurowskiego we współpracy z
SKN Data Science Management
. Projekt ma służyć merytorycznej wymianie
doświadczeń
(seminaria, dyskusje panelowe, warsztaty) oraz
networkingowi
i budowie środowiska
liderów nowej ekonomii
. W założeniu ma być pomostem miedzy nauką a biznesem, tworząc
praktyczną teorię
. W ramach tego cyklu spotkań zapraszani są do SGH uznani przedstawiciele świata teorii i praktyki, którzy dzielą się swoją wiedzą, pasją i doświadczeniami ze studentami, przedsiębiorcami i akademikami.
Data Science in Practice
Platon
uważał, że to, co widzimy, może być tylko
tańczącymi na ścianie cieniami prawdziwych rzeczy.

Jaskinia platońska - obraz przedstawia uwięzionych w jaskini ludzi, skrępowanych łańcuchami, którzy oglądają jedynie cienie (zjawiska) prawdziwej rzeczywistości.
Dno jaskini, w którym znajdują się ludzie, to świat doczesny, w jakim żyją. Łańcuchy, które krępują ludzi, to rzeczy, sprawy, które wiążą ich ze światem doczesnym. Cienie natomiast, które widzą ci ludzie, są odbiciem prawdziwej idei. Platon uważał, że tylko dzięki wyzwoleniu się z łańcuchów, tj. od spraw życia doczesnego, ludzie są w stanie poznać prawdę wyższą, czyli świat idei. Dusza ludzka jest w stanie poprzez anamnesis, czyli przypomnienie, dojść do świata idei.
Ogólna teoria względnosci, prawa mechaniki kwantowej:
Widzimy to, co oczekujemy zobaczyć i dzieje się to wtedy kiedy na to patrzymy. Zupełnie jak mapa gry
komputerowej która jest ładowana tylko w takim stopniu jaki jest konieczny.
Wystarczyły dwie minuty paniki aby z Wall Street odpłynęło 136 miliardów $.

Wzrost cen ropy WTI po fałszywych tweetach o śmierci Prezydenta Syrii Bashar al.-Assad

GDPR (General Data Protection Regulation)
Dokument wszedł w życie 25 maja 2016 roku, w całej UE jego wytyczne będą obowiązywać od maja 2018 roku.
Przepisy, które wejdą w życie, zabraniają firmom internetowym rozpowszechniania jakichkolwiek informacji o danym użytkowniku bez wyraźnej i potwierdzonej zgody tej osoby.
Przedsiębiorstwa nie będą już musiały rejestrować w GIODO swoich baz danych, natomiast mają obowiązek zbudować system ochrony danych zgodnie z wymogami rozporządzenia. Przede wszystkim muszą zapewnić całościową ochronę danych osobowych, Oznacza to również zobowiązanie do stosowania takich środków technicznych i organizacyjnych, które zapewnią domyślne przetwarzanie jedynie danych koniecznych do realizacji konkretnego celu.
Nowe rozporządzenie reguluje też kwestię tzw. prawa do bycia zapomnianym. Osoba, której dane dotyczą, będzie mogła żądać ich usunięcia, jeżeli dane te nie będą niezbędne do celów, w których były zbierane. Będzie też mogła cofnąć zgodę na ich przetwarzanie.
Tam gdzie dojdzie do naruszenia bezpieczeństwa danych nakładane będą grzywny w wysokości do 4% rocznego globalnego przychodu lub 20 mln euro, w zależności od tego, która kwota będzie wyższa.
Wykłady z praktykami
1.
"Nowe modele biznesowe oraz tworzenia wartości z danych"

Celem spotkania była próba odpowiedzi na pytania:
Jak stworzyć start-up?
Jak rozwijać i zarządzać start-upem międzynarodowym?
Jakie są główne czynniki sukcesu start-upu?
Jak ocenić perspektywy rozwoju start-upu?
Jak dzięki automatyzacji kreować wartości w erze cyfrowej?
Goście specjalni:
Kacper Winiarczyk — Dyrektor Generalny
UBER
a
Kamil Bargiel — Prezes
SentiOne

2.
"Quo Vadis BIG DATA - trendy i przestrzenie wartości”

Celem spotkania była próba odpowiedzi na pytania:

Czy Big Data będzie jedynie przelotnym trendem?
Jakie znaczenie dla biznesu będzie miało przetwarzanie danych w przyszłości?
Czy istnieją dane nieprzydatne?
Jakie będą kierunki rozwoju analityki danych?
Jaki jest potencjał polskiego rynku Big Data?
Sztuczna inteligencja + Big Data = ???
Goście specjalni:
Bartosz Baziński – Prezes
SalesLift
Jarosław Królewski – Prezes
Synerise
l
ink do mp3 ze spotkania (audiobook)
-
https://drive.google.com/file/d/0B4phFtGivQYKbkF4WFpCSGVLT28/view?usp=sharing

link do mp3 ze spotkania (audiobook)
https://drive.google.com/file/d/0B4phFtGivQYKcVVvSlZKekF3UVk/view?usp=sharing

Rozmowa o pracę
:)
https://www.facebook.com/Pracuj.pldlaPracodawcow/videos/864249316945617/

Z około 68 twoich polubień można wywnioskować kolor twojej skóry, preferencje seksualne oraz przynależność partyjną. 70 polubień wystarcza, aby maszyna określiła twój charakter lepiej niż przyjaciel. Przy 150, algorytm zna cię lepiej niż rodzice, przy więcej niż 300 – lepiej niż ty sam.

Program, który analizuje każdy twój ruch na Facebooku, został już z powodzeniem wykorzystany w odpowiedzialnej za Brexit kampanii Nigela Farage’a oraz przez sztab prezydenta-elekta Trumpa. Stworzył go zespół prowadzony przez Polaka, Michała Kosińskiego. Do celów politycznych wykorzystuje go firma Cambridge Analytica.
Big data + socjotechnika = ?
https://applymagicsauce.com/

Big data w kampaniach wyborczych
Przegląd zastosowań biznesowych Big Data
deadline: 10 kwiecień 2017

Zadanie ćwiczeniowe - na zajęciach
Data Consulting
Istota monetyzacji Big Data na przykładzie
rynku e-commerce
Full transcript