Portfolio Big Data
PARSEHUB
El dia 12 de gener de 2023 la sortida de la BZRP Music Session #53 amb la cantant Shakira va aclaparar els titulars de bona part dels mitjans del món, tan de parla hispana com internacionals, però a banda d’omplir les primeres planes dels diaris impresos i digitals, així com les entrades dels telenotícies i de la faràndula de la premsa rosa, va alimentar el foc de les converses a les xarxes socials. I és que la cançó ha generat els darrers dies una expectació tan alta, que ha acabat per trencar el rècord de reproduccions d’una producció en castellà en el dia del llançament.
És per aquest motiu, que per realitzar aquesta pràctica es recopilaran dades sobre el top 100 de les cançons més escoltades arreu del món a la plataforma de Youtube i de la plataforma d’Spotify, per tal de veure el volum real que ocupa la figura de la Shakira com a cantant dintre d’aquests tops.
Les dades s’obtenen mitjançant l’eina Parsehub fent scrapping de la pàgina web de kworb.net, que aglutina el nombre de reproduccions de les cançons a les principals plataformes de música en streaming. Un cop fet el bolcat de dades i la neteja, obtenim una taula com la següent:
Pos | Artist and Title | Days | Streams | 7Day | Total | Pos | Artist and Title | Days | Streams | 7Day | Total | |
1 | Bizarrap – Shakira: Bzrp Music Sessions Vol. 53 | 1 | 14.393.342 | 14.393.342 | 14.393.342 | 49 | The Weeknd – Starboy | 931 | 195.047 | 13.540.082 | 1.346.445.158 | |
2 | SZA – Kill Bill | 35 | 7.647.055 | 47.288.509 | 208.044.297 | 50 | The Kid LAROI – Stay | 553 | 194.359 | 13.422.875 | 2.244.267.438 | |
3 | Metro Boomin – Creepin’ | 42 | 4.986.805 | 30.753.658 | 184.223.144 | 51 | Lil Uzi Vert – Just Wanna Rock | 87 | 1.939.831 | 14.146.121 | 146.867.499 | |
4 | Sam Smith – Unholy | 113 | 4.348.035 | 30.733.283 | 676.286.745 | 52 | Feid – Feliz Cumpleaños Ferxxo | 146 | 1.914.956 | 13.614.448 | 249.031.465 | |
5 | Harry Styles – As It Was | 288 | 3.918.581 | 28.522.200 | 1.749.515.613 | 53 | Bad Bunny – Ojitos Lindos | 252 | 1.896.001 | 13.701.369 | 835.016.517 | |
6 | David Guetta – I’m Good (Blue) | 140 | 3.887.734 | 27.260.313 | 568.898.155 | 54 | King – Maan Meri Jaan | 55 | 1.888.974 | 14.237.358 | 98.698.657 | |
7 | Arcángel – La Jumpa | 43 | 3.874.571 | 24.149.297 | 150.844.326 | 55 | Marília Mendonça – Leão | 11 | 1.886.996 | 12.008.314 | 16.498.260 | |
8 | Manuel Turizo – La Bachata | 195 | 3.722.644 | 25.879.286 | 693.098.245 | 56 | Beyoncé – CUFF IT | 145 | 184.474 | 13.334.215 | 301.755.629 | |
9 | Taylor Swift – Anti-Hero | 84 | 3.480.174 | 24.839.659 | 458.799.904 | 57 | The Weeknd – Blinding Lights | 1141 | 1.818.822 | 12.719.479 | 3.278.565.616 | |
10 | Bizarrap – Quevedo: Bzrp Music Sessions Vol. 52 | 190 | 3.430.177 | 21.956.111 | 920.490.035 | 58 | Joji – Glimpse of Us | 217 | 1.788.408 | 12.361.086 | 697.978.803 | |
11 | NewJeans – Ditto | 25 | 3.324.434 | 21.677.065 | 68.067.644 | 59 | KAROL G – CAIRO | 59 | 1.782.381 | 9.073.164 | 78.999.532 | |
12 | RAYE – Escapism. | 46 | 3.262.943 | 21.429.705 | 107.061.787 | 60 | SZA – Shirt | 77 | 1.729.563 | 11.490.684 | 145.618.530 | |
13 | Rema – Calm Down | 140 | 3.033.801 | 20.759.756 | 308.893.083 | 61 | SZA – Snooze | 25 | 1.724.728 | 7.127.404 | 34.649.031 | |
14 | JVKE – golden hour | 143 | 2.991.259 | 19.886.531 | 285.604.748 | 62 | Grupo Frontera – No Se Va – En Vivo | 101 | 1.707.353 | 9.956.140 | 157.197.109 | |
15 | Tom Odell – Another Love | 638 | 2.923.562 | 19.683.471 | 955.929.531 | 63 | SZA – Low | 34 | 1.703.279 | 10.667.485 | 61.227.347 | |
16 | Miguel – Sure Thing | 30 | 2.895.524 | 17.101.609 | 49.592.912 | 64 | RAYE – Escapism. – Sped Up | 18 | 1.695.295 | 8.839.955 | 20.199.572 | |
17 | Ozuna – Hey Mor | 91 | 2.886.725 | 19.067.248 | 228.828.761 | 65 | Sabrina Carpenter – Nonsense | 1 | 1.692.034 | 1.692.034 | 1.692.034 | |
18 | Drake – Rich Flex | 70 | 2.745.659 | 19.354.054 | 265.183.146 | 66 | Billie Eilish – lovely | 1721 | 1.676.266 | 9.864.315 | 2.001.145.261 | |
19 | Central Cee – LET GO | 28 | 2.737.967 | 18.433.690 | 77.590.687 | 67 | ThxSoMch – SPIT IN MY FACE! | 58 | 1.655.932 | 10.009.994 | 69.582.825 | |
20 | OneRepublic – I Ain’t Worried | 222 | 2.733.546 | 19.178.078 | 623.481.059 | 68 | Stephen Sanchez – Until I Found You | 249 | 157.849 | 10.672.440 | 483.290.969 | |
21 | The Weeknd – Die For You | 378 | 2.721.279 | 18.785.838 | 551.435.186 | 69 | The Weeknd – I Was Never There | 227 | 1.572.612 | 10.824.856 | 306.226.937 | |
22 | Fuerza Regida – Bebe Dame | 16 | 2.648.388 | 15.240.261 | 27.937.275 | 70 | Tiësto – 10:35 | 34 | 1.571.497 | 10.410.147 | 41.438.906 | |
23 | d4vd – Here With Me | 78 | 2.645.101 | 18.219.249 | 145.897.424 | 71 | KAROL G – PROVENZA | 266 | 156.815 | 9.394.755 | 637.564.557 | |
24 | Ñengo Flow – Gato de Noche | 21 | 2.608.336 | 16.826.084 | 55.174.215 | 72 | Rauw Alejandro – PUNTO 40 | 96 | 1.558.872 | 8.657.759 | 147.267.898 | |
25 | Shakira – Monotonía | 85 | 2.585.489 | 11.222.037 | 179.866.006 | 73 | Rauw Alejandro – LOKERA | 156 | 1.539.028 | 12.003.294 | 259.627.882 | |
26 | Eminem – Mockingbird | 90 | 2.574.622 | 17.710.376 | 194.749.071 | 74 | Tory Lanez – The Color Violet | 30 | 1.535.389 | 10.203.504 | 35.392.561 | |
27 | Metro Boomin – Superhero (Heroes & Villains) [with Future & Chris Brown] | 42 | 2.567.138 | 14.044.668 | 94.519.639 | 75 | Natanael Cano – AMG | 7 | 1.529.804 | 8.533.272 | 8.533.272 | |
28 | Bad Bunny – Me Porto Bonito | 252 | 2.523.254 | 18.132.776 | 1.081.103.183 | 76 | Hotel Ugly – Shut up My Moms Calling | 61 | 1.521.681 | 9.149.116 | 64.860.411 | |
29 | Yandel – Yandel 150 | 9 | 2.483.331 | 12.150.584 | 14.332.233 | 77 | Bad Bunny – Neverita | 252 | 1.512.472 | 10.933.949 | 471.672.696 | |
30 | Oliver Tree – Miss You | 95 | 2.393.199 | 17.020.232 | 252.458.082 | 78 | Elton John – Cold Heart – PNAU Remix | 518 | 1.506.577 | 10.887.566 | 1.314.935.328 | |
31 | NewJeans – OMG | 11 | 2.362.865 | 16.499.391 | 25.377.440 | 79 | Lewis Capaldi – Someone You Loved | 1455 | 147.602 | 8.843.090 | 2.511.439.441 | |
32 | Meghan Trainor – Made You Look | 82 | 2.329.681 | 18.591.771 | 219.936.069 | 80 | Arctic Monkeys – 505 | 384 | 1.460.865 | 10.378.573 | 498.496.956 | |
33 | Bad Bunny – Tití Me Preguntó | 252 | 2.325.683 | 16.512.099 | 974.249.817 | 81 | Cris Mj – Marisola – Remix | 21 | 1.458.655 | 9.440.695 | 25.506.569 | |
34 | Arctic Monkeys – I Wanna Be Yours | 190 | 2.312.813 | 16.542.826 | 333.434.846 | 82 | Ruth B. – Dandelions | 513 | 1.457.834 | 10.340.508 | 682.859.054 | |
35 | Chris Brown – Under The Influence | 174 | 221.448 | 15.898.859 | 504.622.289 | 83 | Vance Joy – Riptide | 1428 | 1.435.257 | 8.552.102 | 872.163.372 | |
36 | d4vd – Romantic Homicide | 131 | 2.205.831 | 15.716.834 | 285.211.780 | 84 | Dean Lewis – How Do I Say Goodbye | 93 | 1.426.213 | 8.477.040 | 111.805.964 | |
37 | SZA – Nobody Gets Me | 35 | 2.200.635 | 13.664.312 | 86.305.545 | 85 | Bad Bunny – Moscow Mule | 252 | 1.411.384 | 9.932.416 | 709.726.700 | |
38 | Stephen Sanchez – Until I Found You | 41 | 2.152.893 | 21.822.777 | 102.686.559 | 86 | Taylor Swift – Lavender Haze | 82 | 1.409.958 | 9.842.306 | 232.977.068 | |
39 | Steve Lacy – Bad Habit | 190 | 2.147.561 | 15.203.124 | 522.151.495 | 87 | Shakira – Te Felicito | 242 | 1.395.136 | 2.389.362 | 422.238.495 | |
40 | Lady Gaga – Bloody Mary | 46 | 2.140.983 | 14.466.738 | 103.495.249 | 88 | The Weeknd – Call Out My Name | 447 | 1.386.684 | 9.500.339 | 594.310.183 | |
41 | Carin Leon – Que Vuelvas | 17 | 2.089.096 | 11.098.325 | 23.535.024 | 89 | Fujii Kaze – Shinunoga E-Wa | 55 | 1.386.676 | 10.080.283 | 80.349.766 | |
42 | The Neighbourhood – Sweater Weather | 956 | 208.543 | 14.859.289 | 1.330.046.037 | 90 | LE SSERAFIM – ANTIFRAGILE | 87 | 1.382.744 | 10.481.962 | 120.713.245 | |
43 | Rosa Linn – SNAP | 185 | 208.443 | 14.672.479 | 411.891.062 | 91 | Eminem – Without Me | 561 | 1.375.717 | 9.399.089 | 565.811.454 | |
44 | ROSALÍA – DESPECHÁ | 169 | 2.022.972 | 14.534.374 | 520.943.895 | 92 | Arijit Singh – Apna Bana Le (From “Bhediya”) | 17 | 1.365.141 | 9.092.187 | 19.860.040 | |
45 | Glass Animals – Heat Waves | 754 | 2.020.294 | 13.749.412 | 2.113.794.905 | 93 | Rihanna – Lift Me Up | 75 | 1.363.249 | 9.130.914 | 144.954.558 | |
46 | Quevedo – Punto G | 70 | 2.010.254 | 11.387.945 | 99.165.521 | 94 | Rema – Calm Down | 185 | 1.350.784 | 9.675.280 | 194.423.426 | |
47 | Imagine Dragons – Bones | 308 | 2.007.261 | 13.772.742 | 472.773.617 | 95 | NewJeans – Hype Boy | 105 | 1.349.642 | 9.601.175 | 113.642.010 | |
48 | Bad Bunny – Efecto | 252 | 196.088 | 14.156.998 | 776.595.688 | 96 | SZA – Blind | 33 | 1.345.248 | 8.472.711 | 56.556.516 |
Resultats


Per realitzar els gràfics s’han sumat les reproduccions totals del dia 12/01/23 de les cançons de la cantant Shakira que es trobaven dins del top 100 més reproduïdes dins de cadascuna de les plataformes a escala mundial. En el cas d’Spotify són la suma de la Shakira: Bzrp Music Sessions Vol. 53, la cançó Monotonía, i Te felicito. Pel que fa al gràfic de Youtube, les cançons que es troben al top 100 global són: dos vídeos diferents de la cançó Shakira: Bzrp Music Sessions Vol. 53, un vídeo reaccionant a la cançó, Shakira – Waka Waka (This Time for Africa) (The Official 2010 FIFA World Cup™ Song), Monotonía amb Ozuna, Te felicito amb Rauw Alejandro.
Aquests resultats comparats amb el total de reproduccions del top 100 de cadascuna de les plataformes ens mostra que la Shakira va ocupar un 8% del total de les cançons més escoltades d’Spotify i un 22%, gairebé un quart, del total del top 100 cançons més escoltades a nivell mundial a Youtube, evidenciant d’aquesta manera l’impacte mediàtic que va tenir la publicació de la cançó en la popularitat de la cantant.
Seria interessant comparar aquests resultats amb els llançaments d’altres artistes a nivell mundial per veure quin percentatge d’escolta dins del top 100 tenen en comparació als de la Shakira.
POWER BI
La pràctica de Power BI s’ha enfocat cap a una temàtica completament diferent de la de ParseHUB. En aquest cas s’ha volgut crear una visualització de dades relacionada amb les xifres de recaptació i nombre d’espectadors a les províncies de l’estat espanyol durant el transcurs del 2021, ja que el resum del passat 2022 encara no ha estat publicat. Les dades s’han extret de la pàgina web del Ministeri de Cultura i Esports del govern espanyol i han estat processades amb Excel abans d’importar les columnes a Power BI. La taula que proporciona l’administració diferencia els totals d’espectadors i recaptació tenint en compte si les pel·lícules són de producció espanyola o estrangera, de la mateixa manera que desglossa les dades entre els totals de les províncies i la capital de província. Pel que aplica a aquesta pràctica, s’han agrupat els totals d’espectadors i recaptació pel total de cine consumit (és a dir, sense tenir en compte l’origen de la producció), i s’han descartat les dades referents a les capitals de província per tal de simplificar la visualització.
Un cop importades les dades a PowerBI, s’ha creat un Dashboard per representar les dades de manera complementària. En aquest cas, un mapa per veure representades les províncies amb la informació vinculada, un gràfic d’àrea ampliada per veure i comparar ràpidament el nombre d’espectadors i de recaptació de cada província. I finalment, un mapa en forma d’arbre per comparar els volums de recaptacions totals per províncies. Cal destacar que el motor de PowerBI estableix un sistema de jerarquia a l’hora de representar localitzacions en el mapa que situa a les províncies per sota dels estats i altres formes d’organització territorial, és per aquest motiu que algunes de les localitzacions, com ara Saragossa les marca a altres punts del món on existeixen regions o ciutats amb el mateix nom.
A continuació trobem el dashboard:
Com podem veure en els resultats les províncies amb el nombre més elevat d’espectadors són Madrid i Barcelona seguides per València, Sevilla, Alacant, Vizcaya i Màlaga. Els mateixos resultats es donen pel que fa al volum de recaptació. La coincidència en els resultats és deguda a la relació gairebé directa que hi ha entre el nombre d’espectadors i el preu de l’entrada que consumeixen, com més espectadors, més entrades, i per tant més recaptació. Les variacions que trobem de percentatges entre algunes províncies pel que fa a recaptació i espectadors poden ser donades pels preus dels cinemes, hàbits de consum dels espectadors (dia de l’espectador), o polítiques d’incentiu a la cultura especifiques de cadascun dels territoris, i hauríem d’estudiar en concret cada cas per treure’n conclusions. Per altra, seria molt interessant comparar les dades d’assistència al cinema amb el volum total de població de les províncies en qüestió, per observar alguna possible desviació en el consum de cinema per capita d’una província en concret.