Infrastructure as Code
Infrastructure as Code on Biga Data
Infrastructure as Code (IaC) to:
Strona tworzona przez pasjonatów i praktyków Big Data
Infrastructure as Code on Biga Data
Infrastructure as Code (IaC) to:
Artykuł poświęcony Confluent Platform 7 której sercem jest Apache Kafka 3
Apache Kafka stała się bazą wielu systemów przetwarzających dane strumieniowe. Jednakże często potrzebujemy rozszerzyć jej możliwości dodatkowymi komponentami jak rejestr schematów, rest proxy, replikację danych, dodatkowe konektory i wiele innych. W takich sytuacjach z pomocą przychodzi nam Confluent Platform, czyli kompletna dystrybucja Big Data, której sercem jest Apache Kafka. Z platformy korzysta obecnie ponad 80% firm z zestawienia Fortune 100. W tym artykule przedstawię najważniejsze…
Instalacja CDP za pomocą Cloudera Managera on premise
Instrukcja instalacji Cloudera Data Platform (CDP) + Cloudera Manager (CM) na CentOS w środowisku nieprodukcyjnym w celu prezentacji lub jako proof-of-concept. Instalujemy Cloudera Manager z JDK, bazą PostgreSQL, usługą Manager Server, Manager Agent i Cloudera Runtime.
Artykuł poświęcony tematyce migracji klastrów Big Data opartych o platformy firmy Hortonworks, w tym także platform chmurowych jak Microsoft Azure HDInsight lub Oracle Cloud Service
Przez długi czas, Hortonworks Data Platform oraz Hortonworks DataFlow były najpopularniejszymi dystrybucjami Big Data na świecie. Ze względu na możliwość korzystania z platformy całkowicie za darmo bez potrzeby jakiejkolwiek rejestracji, tak naprawdę nie wiadomo jako dużo projektów było o nią opartych, ale widząc choćby popularność w internecie w samej Polsce było ich sporo. Niestety dla tych wszystkich firm i projektów, firma Hortonowrks już nie istnieje, zaś sama platforma nie jest już…
Największa konferencja Big Data w Polsce ponownie w Warszawie lub online :)
Miło nam poinformować, że Big Data Technology Warsaw Summit powraca do Warszawy!