DataScript s.r.o.
Apache Spark se rychle stal jedním z nejpopulárnějších frameworků pro zpracování dat. Jeho univerzální API stejně jako široká škála analytických nástrojů vybudovaných jako nadstavba nad Sparkem ho předurčují jako dobrou volbu pro efektivní zpracování různých typů dat (jak v podobě streamu, tak i pro klasické batch zpracování). V tomto kurzu se podíváme na celou řadu možných použití Sparku ať už jako vysoce škálovatelného ETL nástroje s použitím Spark SQL nebo jako nástro ...
Cena kurzu: ...
23.500
Kč / Kurz
... včetně DPH: 28.435 Kč / Kurz
Objednat - pro přihlášení na kurz/školení klikněte na zvolený termín školení a místo konání
Popis kurzu Introduction to Apache Spark
Kurz je určen pro ...Cílová skupina - Softwarové vývojáře a architekty
- Datové analytiky, Data scientists
- IT nadšence
Lektoři kurzuIVO LAŠEK Ivo pracuje jako softwarový architekt v Big Data týmu v MSD. Před nástupem do MSD spoluzakládal několik startupů úspěšně prodaných firmám Mladá fronta a Seznam.cz. S Apache projekty orientovanými na zpracování dat pracuje už více než 8 let (Apache Solr a později Elastic, Hadoop od verze 0.2, Apache Spark od roku 2015). Ivo získal PhD v oblasti Semantický web a zpracování dat na webu na Fakultě informačních technologií ČVUT.
[Kurz] Program kurzu (obsah přednášky/semináře/rekvalifikace/studia) ...
Cíle kurzu Cílem workshopu je seznámit účastníky s nástrojem Apache Spark – jedním z nejpopulárnějších frameworků pro efektivní zpracování velkých objemů dat. Není vyžadována žádná předchozí zkušenost se Sparkem nebo jinými Big Data technologiemi. Kurs poskytuje základní přehled celého ekosystému, stejně jako praktické příklady použití samotného frameworku Apache Spark. * Cílem workshopu je seznámit účastníky s nástrojem Apache Spark – jedním z nejpopulárnějších frameworků pro efektivní zpracování velkých objemů dat. Není vyžadována žádná předchozí zkušenost se Sparkem nebo jinými Big Data technologiemi. Kurs poskytuje základní přehled celého ekosystému, stejně jako praktické příklady použití samotného frameworku Apache Spark. Garant kurzu IVO LAŠEK Ivo pracuje jako softwarový architekt v Big Data týmu v MSD. Před nástupem do MSD spoluzakládal několik startupů úspěšně prodaných firmám Mladá fronta a Seznam.cz. S Apache projekty orientovanými na zpracování dat pracuje už více než 8 let (Apache Solr a později Elastic, Hadoop od verze 0.2, Apache Spark od roku 2015). Ivo získal PhD v oblasti Semantický web a zpracování dat na webu na Fakultě informačních technologií ČVUT. Osnova Úvod
- Co je Apache Spark?
- Co bylo před Sparkem?
- Hadoop ekosystem
- Přehled základních konceptů distribuovaného zpracování dat
Spark – základní koncepty - RDD, DataFrame, Dataset
- DAG – orientovaný acyklický graf
- Jak vypadá Spark cluster
- Spark a Ya>
Spark Core – jak funguje uvnitř - Algoritmy třídění dat
- Spark paměťový model
Spark SQL - Výhody částečně strukturovaných dat
- SQL
- DataFrames
- Úvod
- Joins
- Datové formáty
- DataSets
Spark Streaming - Co je streaming?
- Obecný přehled
- Spark Streaming a Kafka
Spark pro data scientisty - DataScience notebooks
- Interaktivní datová analýza
- Vizualizace dat
Machine Learning Graph processing Testování sparkových aplikací Deployment - Jak rozběhnout Spark v cloudu
Předpoklady účastníka - Předchozí vývojářská zkušenost s programováním ideálně v Javě (může být i Python nebo Scala). Kurz je veden v programovacím jazyce Java.
- Základní znalost bash skriptování.
- Znalost Dockeru je výhodou, ale není nutná. Na začátku kurzu si ukážeme, jak jednoduše rozběhnout Spark a související technologie na svém počítači právě s pomocí Dockeru.
- Není vyžadována předchozí zkušenost se Sparkem a Big Data technologiemi.
Požadavek na BYOD - Počítač s 64bit verzí Windows 10 Pro, Enterprise nebo Education.
- Nainstalovaná podpora Dockeru (instalovaný Docker na Linuxu, případně Docker for Mac nebo Docker for Windows).
[Kurz] Cíl školení / poznámka ke kurzu...
Cíle kurzu Cílem workshopu je seznámit účastníky s nástrojem Apache Spark – jedním z nejpopulárnějších frameworků pro efektivní zpracování velkých objemů dat. Není vyžadována žádná předchozí zkušenost se Sparkem nebo jinými Big Data technologiemi. Kurs poskytuje základní přehled celého ekosystému, stejně jako praktické příklady použití samotného frameworku Apache Spark.
|
[Školení] Další popis kurzu (úroveň, minimální znalosti, informace o cenách kurzu) ...Předpoklady účastníka - Předchozí vývojářská zkušenost s programováním ideálně v Javě (může být i Python nebo Scala). Kurz je veden v programovacím jazyce Java.
- Základní znalost bash skriptování.
- Znalost Dockeru je výhodou, ale není nutná. Na začátku kurzu si ukážeme, jak jednoduše rozběhnout Spark a související technologie na svém počítači právě s pomocí Dockeru.
- Není vyžadována předchozí zkušenost se Sparkem a Big Data technologiemi.
Požadavek na BYOD - Počítač s 64bit verzí Windows 10 Pro, Enterprise nebo Education.
- Nainstalovaná podpora Dockeru (instalovaný Docker na Linuxu, případně Docker for Mac nebo Docker for Windows).
[dotaz na školení/kurz] Formulář pro komentáře, dotazy a odpovědi
DataScript s.r.o. ::
DataScript je autorizovaným poskytovatelem IT kurzů a certifikací. V našich školících prostorách poskytujeme řadu vysoce odborných a respektovaných IT kurzů, specializovaných technologických školení i certifikací IT specialistů, systémových administrátorů a techniků. V nabídce naší činnosti nechybí ani speciální tréninky určené ke zvýšení profesionálních dovedností a schopností odborných pracovníků. DataScript klade důraz nejen na dokonalou teoretickou přípravu a odborné znalosti, ale rovněž na jejich praktické využití a řešení konkrétních situací. DataScript je součástí koncernu Servodata. Společnost Servodata je významným Value Added Distributorem komponent a infrastruktury podnikových ICT řešení. Dlouhodobě se specializuje na distribuci ...Platební podmínky pro účast na kurzuObjednavateli bude zaslána závazná přihláška k podpisu. Poté bude účastník na školení registrován. Objednavatel uhradí částku kurzovného za výše uvedeného posluchače na základě faktury vystavené poskytovatelem.
Poslední aktualizace: 2024-12-18 01:28:41
DataScript s.r.o. |
Introduction to Apache Spark # Počítačové kurzy a semináře - grafika, databáze, programování, web & internet, office, GIS
Téma kurzů nebo školení:
Počítačové a IT kurzy
Programování
Typ kurzu/školení: Kurz
Klíčová slova pro dané školení: apache, brapache, introduction, jedním, nejpopulárnějších, rychle
[RSS] Nechte si posílat nové termíny kurzu
Chcete vědět kdy bude další termín kurzu? - Využijte RSS a nechte si posílat každé změny a/nebo nové termíny kurzu do Vaší čtečky RSS (bez registrace)
Introduction to Apache Spark [RSS] - Novinky a nové termíny kurzu
© DataScript s.r.o. -
Praha 7
::
- DataScript je autorizovaným poskytovatelem IT kurzů a certifikací. V našich školících prostorách poskytujeme řadu vysoce odborných a respektovaných IT kurzů, specializovaných technologických školení i certifikací IT specialistů, systémových administrátorů a techniků. V nabídce naší činnosti nechybí ani speciální tréninky určené ke zvýšení profesionálních dovedností a schopností odborných pracovníků. DataScript klade důraz nejen na dokonalou teoretickou přípravu a odborné znalosti, ale rovněž na jejich praktické využití a řešení konkrétních situací. DataScript je součástí koncernu Servodata. Společnost Servodata je významným Value Added Distributorem komponent a infrastruktury podnikových ICT řešení. Dlouhodobě se specializuje na distribuci ...
Platební podmínky pro účast na kurzuObjednavateli bude zaslána závazná přihláška k podpisu. Poté bude účastník na školení registrován. Objednavatel uhradí částku kurzovného za výše uvedeného posluchače na základě faktury vystavené poskytovatelem.
Komentáře a dotazy na školení a nebo kurz
Podobné kurzy # introduction + to + apache + spark
|