pandas库学习(持续更新)
python pandas库学习
apply()
方法
pandas
中的 apply
方法是一个非常灵活且强大的工具,可用于对 Series
或 DataFrame
对象中的元素、行或列应用自定义函数。下面为你从多个方面详细介绍其用法。
1. 对 Series
对象使用 apply
Series
是一维带标签数组,apply
可对其中每个元素应用指定函数。
基础示例
1 | import pandas as pd |
在这个例子中,multiply_by_two
函数被应用到 Series
的每个元素上,将每个元素都乘以 2。
使用匿名函数(lambda
函数)
1 | import pandas as pd |
lambda
函数让代码更简洁,适合实现简单逻辑。
2. 对 DataFrame
对象使用 apply
DataFrame
是二维表格型数据结构,apply
可按行或列应用函数,通过 axis
参数控制。
按列应用函数(axis = 0
)
1 | import pandas as pd |
这里 axis = 0
表示按列操作,函数会依次对每列进行计算。
按行应用函数(axis = 1
)
1 | import pandas as pd |
axis = 1
表示按行操作,函数会依次对每行进行计算。
3. 传递额外参数
apply
方法允许传递额外参数给自定义函数。
1 | import pandas as pd |
在这个例子中,args
参数是一个元组,包含要传递给 add_value
函数的额外参数。
4. 处理缺失值
apply
方法会自动处理缺失值(NaN
),它会将缺失值原样保留。
1 | import pandas as pd |
可以看到,NaN
值在处理后依然是 NaN
。
5. 返回不同类型结果
apply
方法可以返回不同类型的结果,例如返回 Series
或 DataFrame
1 | import pandas as pd |
这里自定义函数返回一个 Series
,apply
会将这些 Series
组合成一个新的 DataFrame
。
综上所述,pandas
的 apply
方法为数据处理提供了极大的灵活性,能帮助你高效地对数据进行自定义操作。
读取tsv格式文件
我有如下图一个tsv格式文件:
我该怎么把指定的列提取出来呢
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Dedsec的博客!