DataScript s.r.o.
Being professional software developer requires keeping balance of both being an expert on a very narrow field but on the same time being up-to-date with changing challenges of our industry. Big Data is one of those fields that simply can not be ignored by professional software engineer. Environments where infrastructure crash is part of the daily routine, collected data that can not fit on a single machine or data that needs to be processed fast (in matters of seconds, n ...
Cena kurzu: ...
44.500
Kč / Kurz
... včetně DPH: 53.845 Kč / Kurz
Objednat - pro přihlášení na kurz/školení klikněte na zvolený termín školení a místo konání
Popis kurzu Mastering Apache Spark
Kurz je určen pro ...Audience - Software developers
- IT professionals
Lektoři kurzuLektoři z firmy: DataScript s.r.o.
[Kurz] Program kurzu (obsah přednášky/semináře/rekvalifikace/studia) ...Goals Mastering Apache Spark is an extended workshop designed to familiarize attendees with Apache Spark - a well-known engine for fast Big Data processing. From zero to hero means that attendes do not need to have prior knowledge of how Apache Spark works, but after this workshop will be able to spin efficient, robust jobs running on Spark cluster starting from day one. They will not only gain general understanding of what Apache Spark is, what are its modules and how they work. Attendee will get detailed, in-depth insight of Apache Spark internals. This makes this workshop globally unique it prepares its graduates not only to start working with the framework, but also makes them right candidates to tackle any problems that might occur on production - A true heros that each distributed project needs. Instructor Instructor has more then 10 years of profesional experience as software engineer - during which he worked on numerous number of projects for veriety of clients. He often * Mastering Apache Spark is an extended workshop designed to familiarize attendees with Apache Spark - a well-known engine for fast Big Data processing. From zero to hero means that attendes do not need to have prior knowledge of how Apache Spark works, but after this workshop will be able to spin efficient, robust jobs running on Spark cluster starting from day one. They will not only gain general understanding of what Apache Spark is, what are its modules and how they work. Attendee will get detailed, in-depth insight of Apache Spark internals. This makes this workshop globally unique it prepares its graduates not only to start working with the framework, but also makes them right candidates to tackle any problems that might occur on production - A true heros that each distributed project needs. Instructor Instructor has more then 10 years of profesional experience as software engineer - during which he worked on numerous number of projects for veriety of clients. He often call him self a veteran of early Apache Spark adoptions - his first big data project (based on Apache Spark) dates back to 2014. Back then Spark (version 0.9) was still under heavy development, where every problem encountered requried reading Spark s codebase - googling the question was pointless. That being a pain then, prove to be a great asset after a while. Experience gathered was invaluable, allowing Pawel to challange other Spark-based projects he worked on ever since. The knowledge he is now happy to share with you! Recently he was hired to write Apache Spark connector between HDFS & SlamData s Quasar project. Outline - Introduction
- What is Apache Spark?
- What was before?
- Challenges, proble & issues with MapReduce
- The Big Picture
- Spark Core
- RDD
- Transforamtions vs Actions
- Partitions & Tasks
- RDDs for key-value
- Pipelining & Shuffeling
- DAG & Stages
- Resilience
- Performance issues and how to handle them
- Common pitfals (groupBy)
- Deepr knowledge of how cluster works
- Classpath & Serialization issues
- Spark configuration
- Spark UI & Spark history server
- Caching & Checkpointing
- Broadcasts & Accumulators
- Joins
- Spark Core - internals
- The 5 things definig RDD
- Shuffeling algorithms
- Spark Memory Model
- Spark SQL
- Adventages of semi-structured data
- SQL
- Dataframes
- Introduction
- Joins
- JSON
- Parquet
- Avro
- DataSets
- Problems with Dataframes
- Dataset to the rescue!
- What makes Spark SQL run faster
- Structure vs Expression
- Catalyst Optimizer
- Predicate Push Down
- Project Tungsten
- Spark
[Kurz] Cíl školení / poznámka ke kurzu...Goals Mastering Apache Spark is an extended workshop designed to familiarize attendees with Apache Spark - a well-known engine for fast Big Data processing. From zero to hero means that attendes do not need to have prior knowledge of how Apache Spark works, but after this workshop will be able to spin efficient, robust jobs running on Spark cluster starting from day one. They will not only gain general understanding of what Apache Spark is, what are its modules and how they work. Attendee will get detailed, in-depth insight of Apache Spark internals. This makes this workshop globally unique it prepares its graduates not only to start working with the framework, but also makes them right candidates to tackle any problems that might occur on production - A true heros that each distributed project needs. Instructor Instructor has more then 10 years of profesional experience as software engineer - during which he worked on numerous number of projects for veriety of clients. He often call him self a veteran of early Apache Spark adoptions - his first big data project (based on Apache Spark) dates back to 2014. Back then Spark (version 0.9) was still under heavy development, where every problem encountered requried reading Spark s codebase - googling the question was pointless. That being a pain then, prove to be a great asset after a while. Experience gathered was invaluable, allowing Pawel to challange other Spark-based projects he worked on ever since. The knowledge he is now happy to share with you! Recently he was hired to write Apache Spark connector between HDFS & SlamData s Quasar project. |
[dotaz na školení/kurz] Formulář pro komentáře, dotazy a odpovědi
DataScript s.r.o. ::
DataScript je autorizovaným poskytovatelem IT kurzů a certifikací. V našich školících prostorách poskytujeme řadu vysoce odborných a respektovaných IT kurzů, specializovaných technologických školení i certifikací IT specialistů, systémových administrátorů a techniků. V nabídce naší činnosti nechybí ani speciální tréninky určené ke zvýšení profesionálních dovedností a schopností odborných pracovníků. DataScript klade důraz nejen na dokonalou teoretickou přípravu a odborné znalosti, ale rovněž na jejich praktické využití a řešení konkrétních situací. DataScript je součástí koncernu Servodata. Společnost Servodata je významným Value Added Distributorem komponent a infrastruktury podnikových ICT řešení. Dlouhodobě se specializuje na distribuci ...Platební podmínky pro účast na kurzuObjednavateli bude zaslána závazná přihláška k podpisu. Poté bude účastník na školení registrován. Objednavatel uhradí částku kurzovného za výše uvedeného posluchače na základě faktury vystavené poskytovatelem.
Další kurzy a školení: Mastering Apache Spark Odkaz na podobný kurz a/nebo kurz od jiné firmy a v jiné ceně: = Podobný kurz nebo školení
Poslední aktualizace: 2024-11-21 00:26:18
DataScript s.r.o. |
Mastering Apache Spark # Počítačové kurzy a semináře - grafika, databáze, programování, web & internet, office, GIS
Téma kurzů nebo školení:
Počítačové a IT kurzy
Programování
Typ kurzu/školení: Kurz
Klíčová slova pro dané školení: apache, balance, brbeing, developer, keeping, mastering, professional, requires, software
[RSS] Nechte si posílat nové termíny kurzu
Chcete vědět kdy bude další termín kurzu? - Využijte RSS a nechte si posílat každé změny a/nebo nové termíny kurzu do Vaší čtečky RSS (bez registrace)
Mastering Apache Spark [RSS] - Novinky a nové termíny kurzu
© DataScript s.r.o. -
Praha 7
::
- DataScript je autorizovaným poskytovatelem IT kurzů a certifikací. V našich školících prostorách poskytujeme řadu vysoce odborných a respektovaných IT kurzů, specializovaných technologických školení i certifikací IT specialistů, systémových administrátorů a techniků. V nabídce naší činnosti nechybí ani speciální tréninky určené ke zvýšení profesionálních dovedností a schopností odborných pracovníků. DataScript klade důraz nejen na dokonalou teoretickou přípravu a odborné znalosti, ale rovněž na jejich praktické využití a řešení konkrétních situací. DataScript je součástí koncernu Servodata. Společnost Servodata je významným Value Added Distributorem komponent a infrastruktury podnikových ICT řešení. Dlouhodobě se specializuje na distribuci ...
Platební podmínky pro účast na kurzuObjednavateli bude zaslána závazná přihláška k podpisu. Poté bude účastník na školení registrován. Objednavatel uhradí částku kurzovného za výše uvedeného posluchače na základě faktury vystavené poskytovatelem.
Komentáře a dotazy na školení a nebo kurz
Hledáte náhodou nějakou práci?ELASTICSEARCH ADMINISTRÁTOR, Logstash, Kibana] Znalost práce s indexy Znalost práce s Linux OS [RHEL8, Debian10,11] Znalost Apache Kafka a Openshift..., Praha 8 Podobné kurzy # mastering + apache + spark
|