Patterns&practices: soluții big data în Azure

Arhitecții noștri de la patterns&practices au scos un ghid despre dezvoltarea de soluții big data folosind serviciul Hadoop din Azure, cu denumirea HDInsight Service. Da, este o implementare de Hadoop pe care o oferim clienților noștri sub formă de serviciu. Big data este un scenariu excelent pentru cloud, fiindcă stochezi acolo tot ce vrei în storage-ul care devine din ce în ce mai ieftin, apoi, când ai nevoie să macini datele, ridici un cluster de Hadoop și îi dai bătaie atunci când îți trebuie, cât timp îți trebuie.

Recomand cu căldură această lectură lejeră de vară: http://msdn.microsoft.com/en-us/library/dn749874.aspx

Iată și cum se așează aceste soluții big data în tabloul platformei de date Microsoft:

Microsoft data platform

E gata serviciul de Hadoop din Windows Azure

De aseară am lansat servicul de Hadoop din Windows Azure. Se coace cam de multișor. Numele de marketing va fi HDInsight Service dar în spate este Apache Hadoop 100%. Adevărata democratizare a scenariilor de analiză Big Data doar așa se poate face, în cloud. Practic stochezi, stochezi, stochezi datele și, când ai nevoie să le macini (map reduce etc), atunci ridici un cluster de Hadoop, pardon, de HDInsight, le macini și apoi le analizezi așa cum erai obișnuit în BI-ul tradițional cu PowerPivot și Power View. Simplu, elegant.

Vedeți detalii pe blogul Azure la http://blogs.msdn.com/b/windowsazure/archive/2013/10/28/windows-azure-hdinsight-is-now-generally-available.aspx și bineînțeles la http://www.windowsazure.com/en-us/services/hdinsight/.

Refresh de servicii în Windows Azure: Hadoop, HTML5, Dropbox

De la ScottGu aflăm că de luni:

  • serviciul de Hadoop (numit HDInsight) este disponibil în portalul de management și nu mai trebuie să faceți acrobații pentru a-l folosi;
  • Mobile Services suportă acum și clienți HTML5/JS;
  • serviciul Web Sites suportă acum rapid deployment și din Bitbucket sau Dropbox, pe lângă repository-urile de până acum (Team Foundation Service, CodePlex sau GitHub).

Știm că în acest val de actualizări de primăvară așteptați lansarea comercială a servicului Virtual Machines… e pe țeavă. Stay tuned.

Big Data pentru toată lumea

Am fost în audiență la evenimentul ăsta dedicat big data, deși aș fi vrut să vorbesc să le zic vreo două. Foarte faină ideea EuroCloud de a face un astfel de eveniment. Lăsând la o parte detaliile, practic au fost două tabere acolo:

  • unii care vor să țină big data pentru băieții mari: reprezentantul IDC afirmând că dacă nu analizezi peste 100TB înseamnă că nu faci big data, iar reprezentantul Oracle încercând să „vândă” fier/servere la metru pe care a pus un sticker de big data și evitând elegant întrebările de „cât costă?” în stilul „dacă întrebi cât costă, înseamnă că nu îți permiți”,
  • și alți furnizori (Axemblr, Drift Data sau uberVU) care sunt în business-ul de democratizare a big data, care își asumă să facă ei sisteme big data și să vândă servicii punctuale către terți.

Nu e nimic greșit în niciuna din abordări, le-am și spus, haideți să ne vedem de treabă. Ar fi foarte fain dacă am ignora hype-ul big data, care amenință să fie similar cu SOA sau BI, fiindcă fiecare vede în felul său aceste lucruri. Vor fi totdeauna clienți enterprise pentru care un proiect SOA, BI sau Big Data dacă nu e peste un milion de parai, atunci nu este treabă serioasă, și vor exista ceilalți care se vor mulțumi cu utilizări de nișă, specifice nevoilor lor, dar mult mai ieftine.

Guess what? Microsoft este și el în business-ul de democratizare a big data! Imaginați-vă simplitatea de administrare a la Windows aplicată unei platforme deschise de big data bazată pe Apache Hadoop, unde dorește clientul, pe fiarele sale on-premises sau în cloud pe Windows Azure, și decorată cu uneltele de analiză familiare din platforma de BI a Microsoft. Da, tot Excel dragi prieteni. One spreadsheet to rule them all.

Citiți mai multe la http://www.microsoft.com/bigdata/. Tot de acolo puteți descărca soluția on-premises pentru fiarele voastre (HDInsight Server). Pentru a încerca soluția din cloud (găzduită pe fiarele Microsoft) de la https://www.hadooponazure.com/ (ăsta se va numi HDInsight Service și va fi înșurubat între serviciile existente Windows Azure), mergeți prima dată să vă înscrieți pe „connect” la https://connect.microsoft.com/SQLServer/Survey/Survey.aspx?SurveyID=13697. Veți primi pe email un cod de înscriere în câteva zile (e un „human” care aprobă).

Iată și câteva scenarii și surse de date pentru care puteți folosi o soluție de tip big data pentru analiză de date:

  • servicii de localizare și urmărire
  • căutări complexe în legi sau alte arhive de documente
  • analiză de rețele sociale
  • cercetare medicală
  • analiza pierderilor de clienți
  • analiză de publicitate
  • analiză de prețuri
  • monitorizare de echipamente
  • motoare de recomandări
  • culegere de informații
  • optimizarea infrastructurii IT și a aplicațiilor web
  • optimizare de trafic rutier
  • explorare și extracție de zăcăminte naturale
  • prognoză meteo pentru planificare de business
  • administrare de rețele de utilități
  • previziuni în sănătate
  • asigurări personalizate
  • detecție de fraudă

Aveți și alte idei?