DevOps

Apache Flume jako agregator strumieni danych

November 19, 2019 Marcin Wojtczak

W środowiskach Big Data proces przejmowania jest często elementem całości przepływu ETL. Owe przejmowanie danych rozumiemy jako pobieranie treści z takich źródeł jak bazy danych czy pliki. Bardziej złożonymi formami (w większości przypadków) to źródła rzadziej używane na co dzień a więc NoSQL, maile, API, IoT, których skala, różnorodność i złożoność można opisać w dwóch słowach: Volume i Variety. Przy tak dużym surowcu danych naturalną decyzją jest przejście z modelu przetwarzania wsadowego na…

Big Data Compute Edition w Oracle Cloud - część 2

Tworzenie klastra obliczeniowego na infrastrukturze Oracle (część 2)

April 25, 2019 Marcin Wojtczak

Korzystamy z burger-menu (lewy górny róg strony).

Big Data Compute Edition w Oracle Cloud - część 1

Tworzenie klastra obliczeniowego na infrastrukturze Oracle (część 1)

April 25, 2019 Marcin Wojtczak

Przed uruchomieniem klastra należy utworzyć przestrzeń w której będziemy trzymać nasze dane. Do tego posłuży nam koszyczek bucket (nazewnictwo i funkcjonalność tej usługi podobna do AWS).

Rozpoczęcie pracy w chmurze Oracle Cloud

Tworzenie darmowego konta Oracle Cloud

April 24, 2019 Marcin Wojtczak

Przechodzimy na stronę https://myservices.us.oraclecloud.com/mycloud/signup i korzystamy z promocji Get zł1150 of free credits good for up to 3500 hours of Oracle Cloud usage for the next 30 days. Rejestracja jest łatwa. Podajemy nasz adres e-mail i nasz kraj.

Instalacja dystrybucji Hortonworks Data Platform 3.1 za pomocą Apache Ambari

Instalacja HDP 3.1 za pomocą Ambari 2.7 na systemie Red Hat / CentOS 7

April 18, 2019 Radosław Szmit

Instrukcja instalacji dystrybucji Hortonworks Data Platform HDP 3.1 na maszynach z systemem Red Hat 7 lub CentOS 7.

Big Data Passion

DevOps

Apache Flume jako agregator strumieni danych

Big Data Compute Edition w Oracle Cloud - część 2

Big Data Compute Edition w Oracle Cloud - część 1

Rozpoczęcie pracy w chmurze Oracle Cloud

Instalacja dystrybucji Hortonworks Data Platform 3.1 za pomocą Apache Ambari

Ostatnie wpisy

DataMass Gdańsk Summit 2023

Przegląd rozwiazań Big Data On Premise i Chmury Publicznej

Big Data Technology Warsaw Summit 2023

Praca z CLI w Apache Kafka

DataMass Gdańsk Summit 2022

Kategorie

About