Torna all'elenco degli articoli Articoli
Tempo di lettura: 6 minuti

Come utilizzare Google BigQuery per esercitarsi gratuitamente con l'SQL

Volete esercitarvi con l'SQL senza installare nulla e senza spendere un centesimo? Con Google BigQuery Sandbox potete esplorare insiemi di dati reali, scrivere query online e sviluppare le vostre competenze SQL gratuitamente, senza bisogno di carta di credito. Questa guida vi mostrerà come iniziare passo dopo passo.

Che cos'è Google BigQuery?

Google BigQuery è un data warehouse basato su cloud, un tipo di database creato per archiviare e analizzare grandi quantità di dati. È costruito da Google e fa parte di Google Cloud. Si utilizza il linguaggio SQL per cercare, filtrare e analizzare le informazioni memorizzate.

BigQuery è facile da usare per i principianti, perché non è necessario gestire alcun server e dà accesso a serie di dati pubblici gratuiti che si possono esplorare e su cui si può fare pratica fin da subito. Si può iniziare a usarlo con un account Google gratuito, senza bisogno di carta di credito. Se volete provare funzioni più avanzate, Google vi offre anche 300 dollari di crediti gratuiti quando vi iscrivete a Google Cloud.

BigQuery è un ottimo modo per fare esperienza pratica con SQL in un ambiente reale basato sul cloud. È possibile interrogare insiemi di dati interessanti direttamente nel browser, senza bisogno di configurazioni o installazioni. È un punto di ingresso pratico e senza barriere per chiunque stia imparando l'SQL o sia curioso di lavorare con strumenti di dati cloud.

Se siete alle prime armi con SQL, un ottimo modo per iniziare è il corso SQL per principianti corso. Si tratta di un corso interattivo, adatto ai principianti, che vi aiuterà a costruire una solida base, perfetta prima di immergervi in BigQuery.

Che cos'è BigQuery Sandbox?

Google BigQuery Sandbox è una versione gratuita di BigQuery che consente di provarlo senza dover aggiungere una carta di credito. È perfetta per i principianti che vogliono imparare a lavorare con i dati, scrivere query SQL o esplorare insiemi di dati pubblici. È possibile memorizzare fino a 10 GB di dati ed eseguire fino a 1 TB di query al mese gratuitamente. La sandbox offre la maggior parte delle funzioni principali di BigQuery, ma tutte le tabelle create vengono eliminate automaticamente dopo 60 giorni. È un'ottima opzione se volete fare pratica o testare le cose senza preoccuparvi dei costi.

Come configurare la Sandbox di Google BigQuery

Ecco i passaggi per configurare il vostro account BigQuery gratuito:

  1. Creare un account Google o iscriversi all'account Google esistente.
  2. Andare direttamente alla BigQuery Console: https://console.cloud.google.com/bigquery. (Non cercate "BigQuery" su Google: vi porterà a una pagina di marketing invece che alla console).
  3. Create un nuovo progetto Google Cloud o selezionate un progetto esistente.
  4. Se necessario, abilitate l'API BigQuery nel progetto.

Dopo questi passaggi, si arriva all'interfaccia di BigQuery. L'aspetto dovrebbe essere simile a questo:

Come utilizzare Google BigQuery

Primi passi in BigQuery Sandbox

BigQuery Studio vi accoglie con una schermata iniziale. Fate clic su "Open query" per vedere un esempio di query che utilizza uno dei set di dati pubblici.

Come utilizzare Google BigQuery

Se lo si desidera, viene visualizzata anche una breve guida visiva su cui è possibile fare clic. È un modo utile per capire l'interfaccia.

Come utilizzare Google BigQuery

A questo punto viene visualizzato un editor di query con una query SQL di esempio già caricata. Fare clic sul pulsante "Esegui" sopra l'editor per eseguire la query. I risultati appariranno nel pannello "Risultati della query".

Come utilizzare Google BigQuery

Aggiungere dataset pubblici al progetto

Un ottimo punto di partenza sono i dataset pubblici gratuiti di Google. Fare clic sul link seguente per aprire il progetto bigquery-public-data: https://console.cloud.google.com/bigquery?p=bigquery-public-data&d=samples&page=dataset

Assicuratevi di asteriscare il set di dati per facilitarne l'accesso in seguito.

Come utilizzare Google BigQuery

Esplorate i set di dati di questo progetto: troverete dati di esempio su argomenti come le fasi lunari, Wikipedia e altro ancora. Quando si fa clic su un set di dati, viene visualizzata una panoramica di ciò che include.

Come utilizzare Google BigQuery

Facendo clic su una tabella del set di dati, si vedranno ulteriori dettagli:

  • Schema - mostra i nomi delle colonne e i tipi di dati.
  • Dettagli: descrive la tabella o il set di dati.
  • Anteprima: consente di vedere un campione dei dati.

È anche possibile fare clic su "Query" per aprire un nuovo editor di query con quella tabella già referenziata: un ottimo modo per iniziare a scrivere rapidamente le proprie query.

Come utilizzare Google BigQuery

Idee per l'esplorazione

Una volta che si è configurato BigQuery Sandbox, si può iniziare a esplorare i dati del mondo reale utilizzando l'SQL. Ecco alcuni interessanti set di dati pubblici con cui potete giocare e alcune domande di esempio a cui potete provare a rispondere con le vostre query.

⚾ bigquery-public-data.baseball

Questo set di dati include dati dettagliati della Major League Baseball (MLB), tra cui informazioni su giocatori, squadre, partite e statistiche sulle prestazioni nelle diverse stagioni.

Domande da esplorare:

  • Quali giocatori hanno realizzato il maggior numero di fuoricampo in una determinata stagione?
  • Qual è il numero medio di punti segnati per partita da ciascuna squadra?
  • Quali sono i lanciatori con il maggior numero di strikeout?

📰 bigquery-public-data.bbc_news

Questo set di dati include articoli di notizie della BBC, organizzati per categoria e contenuto. È ottimo per esercitarsi a filtrare, raggruppare e contare il testo.

Domande da esplorare:

  • Quanti articoli sono stati pubblicati per ogni categoria (ad esempio, politica, tecnologia, affari)?
  • Quali sono le parole più comuni utilizzate negli articoli relativi allo sport?
  • Quali sono le categorie con il maggior numero di articoli?

🚓 bigquery-public-data.chicago_crime

Questo set di dati contiene dati dettagliati sulla criminalità della città di Chicago, aggiornati settimanalmente. Include tipi di crimini, luoghi e orari.

Domande da esplorare:

  • Quali sono i tipi di reato più comuni a Chicago?
  • Quali sono le aree con il maggior numero di incidenti segnalati?
  • C'è un particolare momento della giornata in cui è più probabile che avvengano dei crimini?

🌝 bigquery-public-data.moon_phases

Questo è un divertente set di dati che tiene traccia delle fasi lunari per data. È ottimo per esercitarsi con le date, i filtri e l'unione con altri dati.

Domande da esplorare:

  • In quali date si è verificata la luna piena nel 2023?
  • Con quale frequenza si verifica la luna nuova?
  • Qual è l'illuminazione media della luna al mese?

🐍 bigquery-public-data.pypi

Questo set di dati contiene i dati di PyPI (Python Package Index), il repository ufficiale di software di terze parti per Python. È possibile esplorare i download e le attività di rilascio.

Domande da esplorare:

  • Quali sono i pacchetti Python più scaricati?
  • Quali pacchetti sono stati aggiornati più frequentemente?
  • Quanti nuovi pacchetti sono stati pubblicati ogni mese nell'ultimo anno?

Questi set di dati offrono un'ottima occasione per esercitarsi nella scrittura di vere query SQL. È possibile utilizzare SELECT, GROUP BY, ORDER BY, COUNT e persino funzioni come DATE_TRUNC() o STRING_CONTAINS() per trovare risposte interessanti. Non c'è bisogno di costruire un database personale: basta scegliere un argomento che vi piace e iniziare a fare query!

Risorse aggiuntive

Se avete appena iniziato a usare SQL e BigQuery, ecco alcune risorse utili per continuare a imparare ed esercitarvi:

Se volete andare oltre le nozioni di base e imparare l'SQL passo dopo passo, o se siete analisti di dati che desiderano rafforzare le proprie competenze in SQL, vi consigliamo il pacchetto Completo per sempre Pacchetto SQL di LearnSQL.com. Vi dà accesso a vita a tutti i corsi interattivi di SQL, da quelli per principianti a quelli avanzati, in modo che possiate imparare al vostro ritmo e acquisire competenze reali e pratiche.