SPSS视频教程内容目录和跳转链接

pandas教程:[17]字符串提取数据

微博@mlln-cn, 并附上文章url链接, 我就能回答你的问题奥!

很多时候数据都是以字符串的形式保存的,比如多选题的答案,很多人都是用‘ABCD’这种形式保存数据,那么我们怎样将这样的数据提取出来,转换成可以统计的数据呢?pandas的extract可以做到这些。

  • 先来创建一个数据序列
    查看一下数据内容
  • 使用extract方法提取数字:它的第一个参数是正则表达式,括号表示要提取的部分
    输出内容为:(注意无法匹配的内容用NaN表示)
  • 假如我们要提取多个数据,可以使用多个括号
    输出内容为:
  • 你要灵活使用问号,它表示可有可无,下面的方式可以匹配字符“c”
    输出内容为:
  • 如果我们想要让输出的结果包含变量名(列名),我们可以使用下面的写法:
    输出结果为:

转载请注明来自DataScience.

邮箱: 675495787@qq.com

赞助

持续创造有价值的内容, 我需要你的帮助