2nd Jul 2025 Tempo di lettura: 10 minuti SQL e relax: 5 insiemi di dati divertenti con cui esercitarsi il venerdì sera Agnieszka Kozubek-Krycuń pratica su sql esercizi online Indice Set di dati sui film di IMDb Set di dati sugli episodi dei Simpson Database LEGO Avvistamenti UFO Il vostro Netflix incartato Bonus: il nostro corso Pratica su SQL Datasets Pronti per SQL and Chill? Siete stanchi dei noiosi dataset di esercitazione che fanno sembrare l'SQL una fatica? Rilassatevi e affinate le vostre capacità con cinque dataset divertenti e stravaganti che fanno sembrare l'apprendimento di SQL più un gioco. È venerdì sera. Non siete dell'umore giusto per uscire, non c'è più niente di buono da guardare in streaming e il vostro cervello ha voglia di qualcosa di più soddisfacente dello scorrere il telefono. Così accendete il portatile, aprite l'editor SQL e vi rilassate in modo diverso. SQL - Structured Query Language - è il linguaggio che alimenta i dati. Vi aiuta a estrarre informazioni da tabelle enormi, a individuare schemi e a rispondere a domande come "Qual è il prodotto più venduto questo mese?" o "Qual è il condimento della pizza preferito dal pubblico?" L'SQL è ovunque, nel mondo degli affari, della tecnologia, del marketing e nel vostro futuro se siete anche solo un po' curiosi di dati. Ma il punto è che imparare l'SQL non significa memorizzare i comandi. Si tratta di fare pratica. Scrivere query, eseguirle, correggerle quando si rompono e festeggiare quei piccoli momenti "a-ha" quando i risultati hanno finalmente senso. Questo significa che la pratica non deve sembrare un compito a casa! Per dimostrarlo, abbiamo raccolto cinque insiemi di dati divertenti, strani e semplicemente interessanti che vi aiuteranno ad affinare le vostre abilità SQL divertendovi. Pensate meno ai database aziendali delle risorse umane, più agli avvistamenti di UFO e alle valutazioni dei film. E se volete mantenere lo slancio, date un'occhiata al percorsoPratica su SQL su LearnSQL.com. Si tratta di un percorso di apprendimento interattivo pensato per tutti coloro che vogliono smettere di leggere di SQL e iniziare a farlo. Facciamo SQL e rilassiamoci. Set di dati sui film di IMDb Cosa c'è nel dataset? I dataset non commerciali di IMDb consentono di accedere a un'ampia gamma di informazioni relative ai film, perfette per essere esplorate con SQL. Il dataset include tabelle multiple collegate (in formato TSV) che coprono: Informazioni di base sui film: Titoli, anni di uscita, generi, durata e se si tratta di film, cortometraggi o episodi televisivi. Dati sulle valutazioni: Valutazione media degli utenti e numero di voti per titolo. Dettagli sulla troupe: Registi e scrittori collegati a ciascun film. Informazioni sul cast: Gli attori e le attrici principali e i loro ruoli. Profili delle persone: Nomi, anni di nascita, professioni e opere degne di nota. Dove trovarlo: https://developer.imdb.com/non-commercial-datasets/ Quali concetti SQL si possono mettere in pratica? IMDb offre un set di dati relazionali con una complessità reale. È l'ideale per esercitarsi con join, filtri, raggruppamenti e altro ancora mentre ci si immerge nel mondo del cinema. SELECT, WHERE, e filtrare per testo o numero ORDER BY per classificare i film in base alla valutazione o alla popolarità GROUP BY e funzioni di aggregazione (come AVG(), COUNT()) LIMIT per trovare i risultati migliori Filtrare con IN, BETWEEN, e LIKE Idee di ricerca divertenti: Quali sono le 10 commedie più votate uscite dopo il 2010? Chi è il regista più costante, che sforna successi su successi senza molti flop? Quali sono i sequel di commedie più votati dell'originale? Quali sono gli attori che hanno recitato nei film più quotati (ad es., valutazione IMDb > 8)? Quali sono i film più lunghi mai realizzati (e ne è valsa la pena)? Livello di competenza consigliato: Da principiante a intermedio. Ottimo per esercitarsi con le abilità fondamentali di SQL con dati reali. Set di dati sugli episodi dei Simpson Cosa c'è nel dataset? I Simpson sono la sitcom animata più longeva della storia della TV, nota per i suoi personaggi stravaganti, l'umorismo tagliente e i commenti sociali sorprendentemente profondi. Questo dataset cattura l'essenza dello show attraverso più di 600 episodi, offrendo un modo strutturato per esplorare Springfield attraverso i dati. Il dataset comprende diverse tabelle collegate: Episodi - Titoli, date di messa in onda, stagioni, numeri di episodio e brevi descrizioni. Personaggi - Tutti i personaggi, dalla famiglia Simpson agli abitanti della città, hanno un ID univoco. Luoghi - Luoghi presenti nella serie, come la Taverna di Moe, la scuola elementare di Springfield e il Kwik-E-Mart. Linee del copione - Oltre 150.000 linee di dialogo, con informazioni su chi ha detto cosa, in quale episodio e dove è successo. Dove trovarlo: https://www.kaggle.com/datasets/prashant111/the-simpsons-dataset Quali concetti di SQL si possono mettere in pratica? Unire più tabelle (personaggi, episodi, luoghi, battute) Filtrare il testo con LIKE e LOWER() Conteggio e raggruppamento con GROUP BY e COUNT() Trovare valori unici con DISTINCT Analizzare le apparizioni dei personaggi con ORDER BY e LIMIT Idee di query divertenti: Quale stagione dei Simpson ha più episodi? Chi parla di più: Bart o Lisa? Ci sono personaggi che appaiono solo in un episodio? Quali sono i 5 luoghi più usati nello show? Quali sono le 10 parole che Homer usa di più? Livello di competenza consigliato: Intermedio. Questo set di dati è ideale per chi ha familiarità con i join ed è pronto a sperimentare dati testuali e query a più tabelle in un contesto divertente. Database LEGO Cosa contiene il dataset? Questo dataset è stato creato per gli amanti dei mattoncini e per gli esploratori di dati. Copre decenni di set ufficiali LEGO, tracciando tutto, dai piccoli pezzi alle enormi collezioni a tema. I dati sono organizzati in tabelle relazionali che consentono di esplorare le modalità di costruzione e catalogazione dei set LEGO. Le tabelle includono: Set - Ogni set LEGO con il suo nome, l'anno di uscita, il tema e il numero di pezzi. Parti - Ogni singolo pezzo, con numeri di parte, nomi e categorie. Colori - Un elenco completo dei colori dei mattoncini LEGO disponibili, compresi i valori RGB. Inventari - Quali pezzi sono presenti in quali set e in quale quantità. Parti dell'inventario: collega i set, le parti e i colori, perfetto per esplorare la costruzione dei set. Temi - Il tema a cui appartiene ogni set (ad esempio, Star Wars, Technic, City). Si tratta di un set di dati giocoso ma ricco, ideale per interrogare le relazioni del mondo reale e per immergersi nel colorato mondo LEGO da una prospettiva di database. Dove trovarlo: Set di dati Kaggle (ultimo aggiornamento nel 2017): https://www.kaggle.com/datasets/rtatman/lego-database Set di dati originale (aggiornato quotidianamente): https://rebrickable.com/downloads/ Quali concetti di SQL si possono mettere in pratica? Multi-tabella JOINs (ad esempio, collegamento di set, parti, inventari e colori) Filtrare con WHERE, IN, e BETWEEN Aggregazione con GROUP BY, COUNT(), e SUM() Ordinare con ORDER BY e limitare i risultati con LIMIT Esplorazione di gerarchie (ad esempio, temi all'interno di temi) Idee di query divertenti: Quale set LEGO ha più pezzi? Quali sono i 5 colori più comuni dei mattoncini LEGO? Quali sono i 5 meno comuni? In quale anno è stato rilasciato il maggior numero di nuovi set LEGO? Ci sono pezzi che compaiono in un solo set? Quali sono i temi con la più alta media di pezzi per set? Quali sono i temi LEGO più colorati (ad esempio, in base al numero di colori diversi dei mattoncini utilizzati)? Livello di competenza consigliato: Intermedio. È perfetto se avete imparato le basi e volete lavorare con più tabelle correlate. Avvistamenti UFO Cosa c'è nel dataset? Questo strano set di dati, unico nel suo genere, raccoglie migliaia di segnalazioni di avvistamenti UFO del XX secolo, raccolte dal National UFO Reporting Center (NUFORC). Ogni registrazione include la data e l'ora dell'avvistamento, la città, lo Stato e il Paese in cui è avvenuto, la forma segnalata dell'UFO, la durata della sua visibilità e persino la descrizione dell'evento da parte del testimone. Con oltre 80.000 voci, complete di coordinate, è il parco giochi perfetto per chiunque sia curioso di conoscere le luci misteriose nel cielo e ciò che i dati dicono su di esse. Dove trovarlo: https://www.kaggle.com/datasets/NUFORC/ufo-sightings Quali concetti di SQL si possono esercitare? Filtraggio per data, ora e testo con WHERE, LIKE, e BETWEEN Aggregazioni con COUNT(), AVG(), e GROUP BY Ordinamento con ORDER BY Lavorare con dati geografici (città, stati, paesi) Idee di base per la pulizia dei dati (ad esempio, filtrare le voci incomplete o anomale) Idee di query divertenti: Quale stato degli Stati Uniti ha avuto il maggior numero di avvistamenti di UFO negli anni '90? Quali sono le forme di UFO più comuni segnalate nel tempo? Ci sono mesi specifici con più avvistamenti di altri? Qual è la durata media di un avvistamento per tipo di forma? Quali città sono "hotspot" per gli UFO in base al numero di segnalazioni? Livello di competenza consigliato: Da principiante a intermedio. È un'ottima scelta se vi sentite a vostro agio con i filtri e i raggruppamenti e volete esplorare i dati basati sul tempo e sulla posizione con un tocco divertente. Il vostro Netflix incartato Cosa c'è nel dataset? Questo dataset è un po' diverso perché è vostro. A differenza della maggior parte dei dataset pubblici, questo proviene direttamente dal vostro account Netflix. In Netflix Wrapped With SQL, vi mostriamo esattamente come scaricare la vostra cronologia di visione personale e trasformarla in qualcosa che potete esplorare con SQL. Molte piattaforme di streaming, come Netflix e Spotify, consentono di accedere ai propri dati. È un ottimo modo per imparare l'SQL con qualcosa a cui si è già connessi. Il file della cronologia delle visualizzazioni di Netflix comprende due colonne principali: Titolo - Il nome del film o dell'episodio guardato. Data - La data esatta in cui è stato guardato. Semplice, ma potente. Con queste sole informazioni, è possibile analizzare le proprie abitudini di visione, individuare gli schemi nel tempo e persino rispondere a domande che non si sapeva di avere sul proprio tempo trascorso davanti allo schermo. Dove trovarlo: Seguite le istruzioni riportate nel nostro precedente articolo Netflix Wrapped With SQL. Quali concetti SQL si possono mettere in pratica? Filtrare per data e titolo utilizzando WHERE, LIKE, e BETWEEN Aggregazione con COUNT(), MAX(), AVG(), e GROUP BY per analizzare le abitudini di visione Ordinare i risultati con ORDER BY per trovare i programmi più visti o i giorni di maggior afflusso di pubblico. Lavorare con le funzioni data/ora per estrarre mesi o giorni della settimana o per calcolare gli intervalli di tempo Pulizia e formattazione di base del testo utilizzando funzioni stringa come SUBSTRING() o TRIM() per i nomi delle serie e degli episodi. Idee di query divertenti: Quali sono le serie TV di cui avete visto il maggior numero di episodi? In quale mese avete guardato più contenuti su Netflix? In quale giorno della settimana premete di solito "Play"? Quali sono i generi che guardate di più (se i dati sui generi sono disponibili)? In media, quanto spesso guardate qualcosa: ogni giorno, ogni pochi giorni o solo nei fine settimana? Livello di competenza consigliato: Da principiante a intermedio. È ideale per chi ha familiarità con le operazioni SQL di base e vuole applicare le proprie competenze a dati personalizzati del mondo reale. Bonus: il nostro corso Pratica su SQL Datasets Volete la libertà di esplorare SQL da soli, ma con database pronti all'uso e ben organizzati? Il corso Pratica su SQL insiemi di dati di LearnSQL.it vi dà accesso a una serie di database realistici provenienti da negozi online, università, musei e piattaforme musicali. A differenza dei tipici corsi che prevedono attività passo-passo, questo vi lascia liberi di muovervi. Esplorerete da soli le strutture dei database, formulerete le vostre domande e scriverete le query per rispondervi. I database del corso comprendono: Un sistema universitario (studenti, corsi, voti) Un negozio di e-commerce (ordini, prodotti, clienti) Analisi del blog (pagine viste, comportamento degli utenti) Un negozio di musica digitale (artisti, album, acquisti di brani) Il Museo d'Arte Moderna (opere d'arte e artisti) È perfetto per esercitarsi nell'unione, nel raggruppamento, nel filtraggio e nella scrittura di SQL reale, senza dover impostare nulla. Scoprite il corso su: Pratica su SQL Insiemi di dati su LearnSQL.com Pronti per SQL and Chill? Esercitarsi con l'SQL non deve per forza sembrare un lavoro, e di sicuro non deve coinvolgere noiosi database di dipendenti. Che siate appassionati di film, di avvistamenti di UFO, di set LEGO o della vostra storia su Netflix, c'è un set di dati che può far sembrare l'apprendimento un gioco. La prossima volta che avete una serata tranquilla, provate a eseguire qualche query stravagante invece di limitarvi a scorrere. Chissà, potreste scoprire un nuovo modo preferito di rilassarvi. E se volete fare ancora più pratica, date un'occhiata alla nostra tracciaPratica su SQL . Le vostre future competenze in SQL (e il vostro curriculum) vi ringrazieranno. Tags: pratica su sql esercizi online