22nd Jan 2025 Tempo di lettura: 8 minuti Netflix avvolto da SQL: Immergiamoci nell'anno dello streaming Jakub Romanowski postgresql analisi dati pratica su sql Indice Fase 1: Acquisire i dati di Netflix Passo 2: caricarlo in PostgreSQL (in modo divertente) Fase 3: vedere quali sono le serie più seguite Fase 4: individuare le tendenze dell'anno Fase 5: Scoprire modelli sorprendenti Netflix avvolto con l'uso di SQL In questo articolo, trasformeremo la vostra cronologia di visione di Netflix nel vostro Netflix Wrapped personale, utilizzando SQL. Vi siete mai chiesti quale sia il programma che avete seguito di più o quale sia il giorno in cui non avete resistito a premere play? Vi mostrerò come ottenere tutte queste informazioni divertenti. Diamoci dentro! L'anno è quasi finito, quindi perché non dare un'occhiata alle vostre abitudini su Netflix? Ricordate tutti quei fine settimana in cui dicevate di "guardare solo un episodio"? Sì, anch'io. Con SQL, potete trasformare la vostra cronologia di visione di Netflix in informazioni interessanti, come trovare gli spettacoli più visti o scoprire i vostri modelli di binge-watching. È più facile di quanto si possa pensare e, onestamente, è molto divertente vedere i dati esposti! Se questo vi sembra il vostro genere, potreste anche leggere il mio altro articolo su come analizzare i dati di Spotify Wrapped con SQL. Ma torniamo ai film e alle serie. Fase 1: Acquisire i dati di Netflix Prima di tutto è necessaria la cronologia degli ascolti di Netflix. È qui che inizia tutto! Dovrete scaricare i dati che Netflix ha conservato in silenzio su tutto ciò che avete guardato. Ecco cosa dovete fare: Accedere a Netflix nel browser (credetemi, è molto più facile in questo modo). Cliccate su Impostazioni account (è sotto l'immagine del vostro profilo). Vai su Profilo e controllo genitori, seleziona il tuo profilo e fai clic su Attività di visualizzazione. Scorrete fino in fondo e cliccate su Scarica tutto. Bum! Avrete un file CSV con tutto ciò che avete guardato. Capito? Perfetto! Andiamo avanti. Passo 2: caricarlo in PostgreSQL (in modo divertente) PostgreSQL è un potente sistema di database relazionale open-source, perfetto per gestire dati strutturati come la cronologia degli ascolti di Netflix. È affidabile, versatile e ampiamente utilizzato in ogni ambito, dai progetti personali alle applicazioni aziendali. Per rendere le cose ancora più semplici, useremo pgAdmin, un'interfaccia grafica amichevole per gestire i database PostgreSQL. Considerate pgAdmin come il vostro centro di comando: vi permette di creare database, eseguire query e visualizzare i dati senza dover memorizzare una tonnellata di comandi SQL. Se siete alle prime armi con questi strumenti, date un'occhiata a questa guida per principianti: Come installare e configurare PostgreSQL con pgAdmin. Questa guida vi guiderà attraverso l'intero processo, rendendo molto semplice l'avvio. Ora, inseriamo i dati in PostgreSQL e iniziamo a giocare con essi. Ecco come procedere: Aprite pgAdmin e collegatevi al vostro server PostgreSQL. Aggiungete una tabella per i vostri dati scrivendo questa query nello strumento Query: CREATE TABLE NetflixViewingHistory ( Title TEXT, Date DATE ); Importare il file CSV: Fare clic con il pulsante destro del mouse sulla tabella e selezionare Importazione/Esportazione. Scegliere il file CSV, mappare le colonne su Title e Date e fare clic su OK. Volete fare le cose in grande? È anche possibile importare i dati con una query SQL: COPY NetflixViewingHistory(Title, Date) FROM '/path/to/your/NetflixViewingHistory.csv' DELIMITER ',' CSV HEADER; Basta sostituire /path/to/your/NetflixViewingHistory.csv con il percorso reale del file. E così i dati sono pronti per essere importati! Per verificare i dati e assicurarsi che tutto sia stato caricato correttamente, è possibile eseguire una semplice query SQL per controllare la tabella: SELECT * FROM NetflixViewingHistory LIMIT 10; In questo modo verranno visualizzate le prime 10 righe della tabella. Se le serie, le date e i dettagli sono ordinati in colonne, il gioco è fatto! Fase 3: vedere quali sono le serie più seguite Bene, cerchiamo di capire quali serie vi hanno tenuto incollati allo schermo quest'anno. Invece di esaminare tutti i titoli, questa query si concentra sulla ricerca delle serie più seguite raggruppando gli episodi. Eseguendo questa query, si scopriranno le serie che hanno dominato il tempo trascorso su Netflix. Questa query conta il numero di episodi guardati di ogni serie, dando un chiaro vincitore per le serie più seguite. È stato Friends? Forse Stranger Things? Diamo un'occhiata: SELECT SPLIT_PART(Title, ':', 1) AS Series, COUNT(*) AS WatchCount FROM NetflixViewingHistory GROUP BY Series ORDER BY WatchCount DESC LIMIT 10; Questa query fornisce un elenco delle serie più seguite. Nei miei risultati, "Friends" ha conquistato il primo posto, con "The Office" e "Dr House" alle spalle. Tra le altre serie più seguite ci sono "Vikings", "Breaking Bad" e "Cobra Kai". Anche "Designated Survivor" e "Fauda" sono entrati nella lista, mostrando un mix piuttosto eclettico! Ora tocca a voi. Qual è la vostra lista? La vostra serie preferita di sempre ha fatto centro o c'è stato un concorrente a sorpresa in cima alla lista? Provate e fatemi sapere! Fase 4: individuare le tendenze dell'anno Diventiamo nerd con alcune statistiche mensili per scoprire le vostre tendenze di visione. Avete guardato di più durante i freddi mesi invernali o l'estate è stata la vostra stagione di abbuffate di Netflix? Utilizzando l'SQL, possiamo analizzare la vostra cronologia di visione mese per mese per vedere come sono cambiate le vostre abitudini nel corso dell'anno. Ecco una query SQL molto interessante: SELECT EXTRACT(YEAR FROM Date) AS Year, EXTRACT(MONTH FROM Date) AS Month, COUNT(*) AS TotalViews FROM NetflixViewingHistory GROUP BY Year, Month ORDER BY Year DESC, Month DESC; Questa query vi fornirà una ripartizione mese per mese del numero di spettacoli o film che avete guardato. Ad esempio, potreste notare un picco a dicembre grazie agli speciali delle feste o a luglio durante le pigre serate estive. Nel mio caso, dicembre è stato un mese di punta: un mese pieno di serate al cinema. Volete sapere quale mese del 2024 ha avuto il maggior numero di visualizzazioni? Provate questa query: SELECT EXTRACT(MONTH FROM Date) AS Month, COUNT(*) AS TotalViews FROM NetflixViewingHistory WHERE EXTRACT(YEAR FROM Date) = 2024 GROUP BY Month ORDER BY TotalViews DESC LIMIT 1; Questa query identifica il singolo mese più trafficato del 2024. Per me, febbraio è stato il chiaro vincitore: sono riuscito a guardare ben 77 spettacoli e film! Sembra che le accoglienti serate invernali siano state perfette per le maratone di Netflix. Ma quale film o serie è stato il più popolare tra quelli guardati a febbraio? Scopriamolo con queste query: SELECT SPLIT_PART(Title, ':', 1) AS Series, COUNT(*) AS TotalViews FROM NetflixViewingHistory WHERE EXTRACT(YEAR FROM Date) = 2024 AND EXTRACT(MONTH FROM Date) = 2 GROUP BY Series ORDER BY TotalViews DESC; Queste query mostreranno il vostro titolo preferito e la serie più vista nel mese di febbraio. Nel mio caso, la maggior parte dei 77 film guardati sono stati episodi di "Dr. House" e "Yellowstone". E voi? Era una serie iconica o un film consolatorio che continuavate a guardare? Controllate i vostri risultati! Fase 5: Scoprire modelli sorprendenti Volete sapere qual è il vostro giorno preferito su Netflix? Scopriamo il giorno della settimana in cui siete più propensi a premere play. SQL può rivelarlo facilmente analizzando la cronologia delle visualizzazioni e contando quanti programmi o film avete guardato ogni giorno della settimana. È un modo divertente per individuare i vostri modelli di streaming! SELECT CASE EXTRACT(DOW FROM Date) WHEN 0 THEN 'Sunday' WHEN 1 THEN 'Monday' WHEN 2 THEN 'Tuesday' WHEN 3 THEN 'Wednesday' WHEN 4 THEN 'Thursday' WHEN 5 THEN 'Friday' WHEN 6 THEN 'Saturday' END AS DayOfWeek, COUNT(*) AS Views FROM NetflixViewingHistory GROUP BY DayOfWeek ORDER BY Views DESC; Per me, il risultato è stato abbastanza ovvio: i fine settimana dominano il mio tempo su Netflix! Le domeniche e i sabati erano i miei giorni di punta per le abbuffate. E voi? I fine settimana hanno conquistato la corona o vi ritrovate a guardare di più durante la settimana? SQL consente di scoprire facilmente le vostre abitudini uniche e di rivelare schemi interessanti nella vostra cronologia di visione. Provate a vedere cosa dicono i vostri dati! Netflix avvolto con l'uso di SQL Ce l'avete fatta! Avete appena trasformato la vostra cronologia di visione di Netflix nel vostro personalissimo Netflix Wrapped utilizzando SQL. Non è incredibile vedere tutte queste statistiche? Dalla ricerca delle serie più viste all'individuazione dei giorni di abbuffata preferiti, avete un'istantanea completa delle vostre abitudini di streaming. Conoscete già le mie statistiche, ora è il momento di conoscere le vostre! Quali sono i vostri risultati? Una serie a sorpresa ha conquistato il primo posto, oppure il vostro mese più intenso è stato un vero e proprio shock? Qualunque sia la vostra storia, SQL la rende facile da scoprire e da condividere! Se questo è stato divertente (e siamo sinceri, lo è stato davvero), dovreste dare un'occhiata al percorso" SQL dalla A alla Z". Si tratta di sette fantastici corsi che insegnano tutto, dalle query di base alle abilità più avanzate come join, aggregazioni e subquery. È interattivo, pratico e consente di acquisire competenze passo dopo passo, un po' come abbiamo appena fatto noi, ma a un livello completamente nuovo. Credetemi, questa traccia è il passo successivo perfetto se siete pronti a migliorare il vostro gioco con SQL. Chi lo sa? L'anno prossimo potreste usare SQL per analizzare qualsiasi cosa, dai progressi della vostra forma fisica ai piani di viaggio. Buon streaming e buone interrogazioni. Tags: postgresql analisi dati pratica su sql