Politik

På Big Data Meetup på Yahoo och Bay Area Hadoop User Group

På Yahoo Hadoop Users Group Meetup tillsammans med omkring 300+ andra Big Data och Hadoop-entusiaster.

Ett at Silicon Valleys många hemliga vapen är alla Meetups där programmerare och IT-intreprenörer möts och minglar, äter och lyssnar på föredrag om den senaste IT-teknologin.

Ikväll var jag återigen på en av de mest spännande och välbesökta Meetups, nämligen Bay Area Hadoop User Group med nära 4 000 medlemmar.

Den här gången var Yahoos kafeteria smockfull, det bjöds på sallad, pizza, kakor, öl och läst. Presentationerna var mycket
bra och mycket detaljerade, här är agenda.

Presentationen om Data Pipelines, som används var mycket detaljerad och intressant. Data Pipelines är vad som ligger till grund för Hadoop och om man bara förstår hur dom fungerar så förstår man också mer om Hadoop själv.

MapRs presentation om hur man accessar Hadoop via NFS och ODBC var även och mycket intressant, och presentationen finns på MapRs hemsida.

MapR är en av de ledande distributörerna av Hadoop här i Silicon Valley.

Här är agendan för kvällens träff:

General agenda:

Building Data Pipelines on Hadoop

This talk will review the components required to build large scale data pipelines on Hadoop. The talk will draw on the experience of building large scale data pipelines at Yahoo.
Presenter: Sameer Raheja, Yahoo!

Using Standard File-Based Applications and SQL-Based Tools with Hadoop

MapR makes Hadoop a more open platform by supporting industry-standard interfaces, including NFS and ODBC.
Presenter: Tomer Shiran, MapR

Overview of Oozie Qualification Process

The talk will cover the Oozie QE practice and process in Yahoo!, the types of tests that QE perform before release, and the roadmap.

Presenter: Michelle Chiang, Yahoo!

Ni kan få en aning om hur internationell Silicon Valley är av namnen på de tre föredragshållarna.

Den unga tjej som sköter ruljansen talar f.ö. med en kraftig rysk brytning.

Big Data och Hadoop är en av de allra hetaste teknologierna i det globaliserade kunskapssamhället. Viktigt eftersom alla datakällor idag digitaliseras och fullkomlig spyr ut gigantiska datamängder som måste behandlas och analyseras av Big Data eller rådata-verktyg. Och det är där som Hadoop kommer in i bilden. Hadoop är en vidareutvecklad öppen kod-version av Googles Map Reduce. Som används varje gång vi googlar och Google blixtsnabbt måste analysera gigantiska datamängder för att hitta just vad vi letar efter.

Infrastrukturen som Hadoop och Map Reduce vilar på består av tusentals och åter tusentals distribuerade datorer i datormolnen.

Ett inte helt oviktigt tips: den som är bra på Big Data och Hadoop kan välja och vraka band jobben, och även få jobb här i Silicon Valley, även om det sistnämnda inte är lika enkelt som det borde vara.

Pressklipp:

NyTeknik – Senaste nytt,NyTeknik – Senaste nytt, NyTeknik – Senaste nytt, Computer Sweden 20 senaste nyhet, Computer Sweden 20 senaste nyhet, Computer Sweden 20 senaste nyhet

[tags]Hadoop, Big Data, Yahoo Hadoop, Hadoop Big Data., Big Data Yahoo [/tags]