W środowiskach Big Data proces przejmowania jest często elementem całości przepływu ETL. Owe przejmowanie danych rozumiemy jako pobieranie treści z takich źródeł jak bazy danych czy pliki. Bardziej złożonymi formami (w większości przypadków) to źródła rzadziej używane na co dzień a więc NoSQL, maile, API, IoT, których skala, różnorodność i złożoność można opisać w dwóch słowach: Volume i Variety. Przy tak dużym surowcu danych naturalną decyzją jest przejście z modelu przetwarzania wsadowego na…
Korzystamy z burger-menu (lewy górny róg strony).
Przed uruchomieniem klastra należy utworzyć przestrzeń w której będziemy trzymać nasze dane. Do tego posłuży nam koszyczek bucket
(nazewnictwo i funkcjonalność tej usługi podobna do AWS).
Przechodzimy na stronę https://myservices.us.oraclecloud.com/mycloud/signup i korzystamy z promocji Get zł1150 of free credits good for up to 3500 hours of Oracle Cloud usage for the next 30 days. Rejestracja jest łatwa. Podajemy nasz adres e-mail i nasz kraj.
Instrukcja instalacji dystrybucji Hortonworks Data Platform HDP 3.1 na maszynach z systemem Red Hat 7 lub CentOS 7.