Kan ik een kolom invoegen bij een specifieke kolomindex in panda’s?
import pandas as pd
df = pd.DataFrame({'l':['a','b','c','d'], 'v':[1,2,1,2]})
df['n'] = 0
Hiermee wordt kolom n
als laatste kolom van df
geplaatst, maar is er geen manier om df
te vertellen om n
aan het begin?
Antwoord 1, autoriteit 100%
zie documenten: http://pandas.pydata .org/pandas-docs/stable/generated/pandas.DataFrame.insert.html
gebruik loc = 0 wordt ingevoegd aan het begin
df.insert(loc, column, value)
df = pd.DataFrame({'B': [1, 2, 3], 'C': [4, 5, 6]})
df
Out:
B C
0 1 4
1 2 5
2 3 6
idx = 0
new_col = [7, 8, 9] # can be a list, a Series, an array or a scalar
df.insert(loc=idx, column='A', value=new_col)
df
Out:
A B C
0 7 1 4
1 8 2 5
2 9 3 6
Antwoord 2, autoriteit 9%
Als u een enkele waarde voor alle rijen wilt:
df.insert(0,'name_of_column','')
df['name_of_column'] = value
Bewerken:
U kunt ook:
df.insert(0,'name_of_column',value)
Antwoord 3, autoriteit 2%
Je zou kunnen proberen kolommen als lijst te extraheren, dit naar wens te masseren en je dataframe opnieuw te indexeren:
>>> cols = df.columns.tolist()
>>> cols = [cols[-1]]+cols[:-1] # or whatever change you need
>>> df.reindex(columns=cols)
n l v
0 0 a 1
1 0 b 2
2 0 c 1
3 0 d 2
EDIT: dit kan in één regel; dit ziet er echter een beetje lelijk uit. Misschien komt er een schoner voorstel…
>>> df.reindex(columns=['n']+df.columns[:-1].tolist())
n l v
0 0 a 1
1 0 b 2
2 0 c 1
3 0 d 2
Antwoord 4
df.insert(loc, column_name, value)
Dit werkt als er geen andere kolom is met dezelfde naam. Als een kolom met de door u opgegeven naam al in het dataframe bestaat, zal deze een ValueError opleveren.
U kunt een optionele parameter allow_duplicates
doorgeven met de waarde True
om een nieuwe kolom te maken met een reeds bestaande kolomnaam.
Hier is een voorbeeld:
>>> df = pd.DataFrame({'b': [1, 2], 'c': [3,4]})
>>> df
b c
0 1 3
1 2 4
>>> df.insert(0, 'a', -1)
>>> df
a b c
0 -1 1 3
1 -1 2 4
>>> df.insert(0, 'a', -2)
Traceback (most recent call last):
File "", line 1, in
File "C:\Python39\lib\site-packages\pandas\core\frame.py", line 3760, in insert
self._mgr.insert(loc, column, value, allow_duplicates=allow_duplicates)
File "C:\Python39\lib\site-packages\pandas\core\internals\managers.py", line 1191, in insert
raise ValueError(f"cannot insert {item}, already exists")
ValueError: cannot insert a, already exists
>>> df.insert(0, 'a', -2, allow_duplicates = True)
>>> df
a a b c
0 -2 -1 1 3
1 -2 -1 2 4
Antwoord 5
Hier is een heel eenvoudig antwoord hierop (slechts één regel).
U kunt dat doen nadat u de ‘n’-kolom als volgt aan uw df hebt toegevoegd.
import pandas as pd
df = pd.DataFrame({'l':['a','b','c','d'], 'v':[1,2,1,2]})
df['n'] = 0
df
l v n
0 a 1 0
1 b 2 0
2 c 1 0
3 d 2 0
# here you can add the below code and it should work.
df = df[list('nlv')]
df
n l v
0 0 a 1
1 0 b 2
2 0 c 1
3 0 d 2
However, if you have words in your columns names instead of letters. It should include two brackets around your column names.
import pandas as pd
df = pd.DataFrame({'Upper':['a','b','c','d'], 'Lower':[1,2,1,2]})
df['Net'] = 0
df['Mid'] = 2
df['Zsore'] = 2
df
Upper Lower Net Mid Zsore
0 a 1 0 2 2
1 b 2 0 2 2
2 c 1 0 2 2
3 d 2 0 2 2
# here you can add below line and it should work
df = df[list(('Mid','Upper', 'Lower', 'Net','Zsore'))]
df
Mid Upper Lower Net Zsore
0 2 a 1 0 2
1 2 b 2 0 2
2 2 c 1 0 2
3 2 d 2 0 2