Wat zijn de verschillen tussen Panda’s en NumPy+SciPy in Python?

Ze lijken allebei buitengewoonop elkaar en ik ben benieuwd welk pakket voordeliger is voor financiële data-analyse.


Antwoord 1, autoriteit 100%

pandas biedt hoogwaardige tools voor gegevensmanipulatie die bovenop NumPy zijn gebouwd. NumPy is op zichzelf een tool op een redelijk laag niveau, vergelijkbaar met MATLAB. pandas biedt daarentegen uitgebreide tijdreeksfunctionaliteit, gegevensuitlijning, NA-vriendelijke statistieken, groupby-, merge- en join-methoden en tal van andere gemakken. Het is de laatste jaren erg populair geworden in financiële toepassingen. In mijn komende boek zal een hoofdstuk gewijd zijn aan financiële gegevensanalyse met behulp van panda’s.


Antwoord 2, autoriteit 19%

Numpy is vereist door panda’s (en door vrijwel alle numerieke tools voor Python). Scipy is niet strikt vereist voor panda’s, maar wordt vermeld als een “optionele afhankelijkheid”. Ik zou niet zeggen dat panda’s een alternatief zijn voor Numpy en/of Scipy. Het is eerder een extra tool die zorgt voor een meer gestroomlijnde manier van werken met numerieke en tabelgegevens in Python. Je kunt gegevensstructuren van panda’s gebruiken, maar vrijelijk tekenen met Numpy- en Scipy-functies om ze te manipuleren.


Antwoord 3

Panda’s bieden een geweldige manier om tabellen te manipuleren, omdat je binning eenvoudig kunt maken (binning van een dataframe in panda’s in Python) en bereken statistieken. Een ander ding dat geweldig is in panda’s is de Panel-klasse waarmee je reeksen lagen met verschillende eigenschappen kunt samenvoegen en deze kunt combineren met de groupby-functie.

Other episodes