Hoe Hadoop online te oefenen: 11 stappen (met afbeeldingen)

Inhoudsopgave:

Hoe Hadoop online te oefenen: 11 stappen (met afbeeldingen)
Hoe Hadoop online te oefenen: 11 stappen (met afbeeldingen)

Video: Hoe Hadoop online te oefenen: 11 stappen (met afbeeldingen)

Video: Hoe Hadoop online te oefenen: 11 stappen (met afbeeldingen)
Video: how to make a calculator in batch file #batch_file #how_to_make_calculator #command_prompt #cmd 2024, April
Anonim

Als een van de krachtigste open-source programmeerframeworks is Hadoop een belangrijk hulpmiddel voor iedereen die een big data-baan wil vinden. Als je je Hadoop-vaardigheden wilt opfrissen of leren beheersen, kun je het beste een online cursus volgen. Als dat niet voor u beschikbaar is, bekijk dan gratis online tutorials en gebruik referentiemateriaal om specifieke problemen op te lossen. Zodra je de basis onder de knie hebt, oefen je op kleine sets met real-world data om je vaardigheden te verbeteren.

Stappen

Methode 1 van 2: Cursussen volgen en zelfstudies gebruiken

Oefen Hadoop Online Stap 1
Oefen Hadoop Online Stap 1

Stap 1. Meld je aan voor Cloudera voor een 6-delige cursus en interactieve tutorials

Cloudera geeft je praktijkvoorbeelden om op te oefenen in een alleen-lezen omgeving, zodat je je geen zorgen hoeft te maken over het maken van grote fouten. Ze bieden ook analytische tools om u te helpen experimenteren met het opvragen van gegevens, evenals een gratis live demo genaamd Cloudera Live om u te helpen de Hadoop-omgeving te leren kennen.

Hoewel de volledige, diepgaande cursus met certificering je $ 295 kost, is het zeker de moeite waard als je deze vaardigheden voor je werk gebruikt. Het gebruik van de Cloudera-cursus helpt je om fouten op te sporen en tijd te besparen, waardoor het zichzelf snel terugbetaalt

Oefen Hadoop Online Stap 2
Oefen Hadoop Online Stap 2

Stap 2. Probeer gratis online cursussen via Cloudera als je de basis al kent

Als je ervaring hebt met Hadoop en gewoon een opfriscursus wilt, hoef je misschien niet het geld uit te geven voor de 6-delige cursus. Bekijk in plaats daarvan de gratis online cursussen op de Cloudera University-website.

Er zijn bronnen voor beheerders, ontwikkelaars en data-analisten, dus wat uw rol ook is, u moet een geschikte cursus kunnen vinden

Oefen Hadoop Online Stap 3
Oefen Hadoop Online Stap 3

Stap 3. Volg een cursus op universitair niveau op Coursera als je meer theorie wilt

Coursera is een bekende, gerespecteerde bron van programmeercursussen. Hoewel de instructies over het algemeen meer theoretisch zijn en niet zoveel lopende voorbeelden bevatten, kun je naast de tutorial oefenen en de cursusprojecten gebruiken om praktische ervaring op te doen.

  • U kunt deze cursus online vinden op
  • De kosten variëren tussen cursussen, maar Coursera biedt ook een optie voor financiële hulp aan degenen die in aanmerking komen.
Oefen Hadoop Online Stap 4
Oefen Hadoop Online Stap 4

Stap 4. Volg een gratis cursus op Big Data University voor een kostenvriendelijke optie

Als je niet wilt betalen voor een online cursus, is Big Data University een goede optie. Ze hebben een tweedelige cursus, die zich eerst richt op de basisprincipes van Hadoop en vervolgens op programmeren met Hadoop, en het online formaat maakt het gemakkelijk om in je eigen tempo te gaan.

  • Je vindt deze cursussen op
  • Ze bieden veel tutorials in het Engels, maar ook in Japans, Spaans, Portugees en Russisch.
Oefen Hadoop Online Stap 5
Oefen Hadoop Online Stap 5

Stap 5. Zoek naar walkthroughs op YouTube als je gratis, specifieke training nodig hebt

Er zijn duizenden video's gemaakt om Hadoop uit te leggen en hoe het te gebruiken. Het brede scala aan video's geeft je flexibiliteit, en het is gratis. Als je een specifiek probleem tegenkomt, zoek dan op YouTube naar een video die je door het proces leidt.

Hadoop-tutorials moeten ook vrij gemakkelijk te vinden zijn, aangezien "hadoop" een unieke zoekterm is

Oefen Hadoop Online Stap 6
Oefen Hadoop Online Stap 6

Stap 6. Gebruik de gratis tutorials van Yahoo als je wilt oefenen met een virtueel voorbeeld

Deze tutorials zijn opgedeeld in 7 modules en ze geven je vanaf het begin instructies over het installeren en bedienen van Hadoop. Dit is een geweldige optie om specifieke vaardigheden op te frissen als ze een beetje roestig zijn.

Oefen Hadoop Online Stap 7
Oefen Hadoop Online Stap 7

Stap 7. Raadpleeg het IBM Open Source-document voor gratis, diepgaande instructies

Dit is een ongelooflijk grondig, open-source PDF-document gemaakt door een IBM-trainingsinitiatief. Het leidt je zorgvuldig, stap voor stap door Hadoop en geeft duidelijke schriftelijke instructies.

Deze instructies werken ook goed in combinatie met een live demo zoals Cloudera

Methode 2 van 2: Overstappen naar real-world applicatie

Oefen Hadoop Online Stap 8
Oefen Hadoop Online Stap 8

Stap 1. Vraag of je Hadoop op het werk kunt implementeren om te oefenen met echte data

Dien een verzoek in bij je baas of leidinggevende, of praat een-op-een met hen over het toepassen van deze nieuwe vaardigheden op de werkplek. Dit is vooral belangrijk als uw bedrijf heeft betaald voor trainingen of online cursussen.

Hoe eerder je begint met het implementeren van de vaardigheden die je hebt geleerd, hoe eerder je ze onder de knie hebt

Oefen Hadoop Online Stap 9
Oefen Hadoop Online Stap 9

Stap 2. Zoek naar eenvoudige projecten om je vaardigheden op te oefenen

Kies projecten die relatief eenvoudig en risicoarm zijn, zoals het tellen en rangschikken van het aantal interacties per klantagent, zoals e-mails en chatsessies.

  • Enkele andere echte datatoepassingen zijn het scannen door weblogs op fouten of het controleren van sociale mediakanalen op merksentiment.
  • U kunt ook oefenen met voorbeeldgegevens van sites zoals https://www.kaggle.com/datasets of
Oefen Hadoop Online Stap 10
Oefen Hadoop Online Stap 10

Stap 3. Controleer uw code regelmatig met kleine subsets om eventuele bugs op te lossen

Voordat u de volledige set gegevens uitvoert, neemt u een kleinere testgegevensset op uw lokale computer en voert u deze door verschillende modi. U kunt het bijvoorbeeld iteratief uitvoeren via de lokale Jobrunner-modus, vervolgens de pseudo-gedistribueerde modus en vervolgens de volledig gedistribueerde modus.

  • Hierdoor kunt u eventuele fouten of bugs herkennen voordat ze worden versterkt in de volledige dataset.
  • Met de lokale Jobrunner-modus kunt u uw Map- en Reduce-code lokaal testen en debuggen, de pseudo-gedistribueerde modus bootst de productieomgeving na en de volledig gedistribueerde modus kijkt naar uw echte productiecluster.
Oefen Hadoop Online Stap 11
Oefen Hadoop Online Stap 11

Stap 4. Gebruik een gratis proefperiode van 1 jaar om te oefenen op een virtuele machine-omgeving

Bedrijven zoals Amazon en Microsoft bieden betaalde abonnementen aan voor hun Hadoop-oefendiensten. De virtuele machine van Amazon heet Amazon Web Service (AWS) en de service van Microsoft heet Microsoft Azure. Voor beide diensten is uw eerste jaar gratis wanneer u uw creditcardgegevens invoert.

Vergeet niet het abonnement na 1 jaar op te zeggen om te voorkomen dat er kosten in rekening worden gebracht

Tips

  • Houd er rekening mee dat Hadoop een meer gespecialiseerde programmeertaal voor beperkt gebruik is. Het zal je zeker een voorsprong geven in de big data-wereld, maar het is niet altijd nodig om programmeur te worden.
  • Je kunt ook boeken en artikelen over Hadoop lezen, zoals Hadoop: The Definitive Guide, 3rd Edition door Tom White.

Aanbevolen: