Pandas之字符串操作
从网络采集来的数据集往往是杂乱无章的,而使用 Python 处理字符串往往是比较容易的,Pandas 同样提供了一系列向量化字符串操作方法
一、Pandas字符串操作:.str
假设有以下的 Series 实例:
如果用函数向量化的方法,对上面的 Series 中的字符串进行处理,比如所有单词的首写字母都转化为大写,是可行的,但是如果 Series 中的字符串包含缺失值,就需要进一步修改向量化的函数,比较繁琐,此时,对字符串进行处理最快速的是使用 Pandas 的字符串操作方法:
Series 还有一些字符串的切片以及合并操作,都可以通过 .str 的方法来调用: