python里折腾的数据，差不多80% 都是这玩意儿。要是不去学学怎么把它们弄进python里折腾折腾，数据分析这条

真不明白为啥咱们总把文本数据给忘了，你看那真实世界里的数据，差不多80%都是这玩意儿。要是不去学学怎么把它们弄进Python里折腾折腾，数据分析这条路肯定能踩满坑。咱们接下来用最简洁的代码，直接把文本处理的这个“任督二脉”给打通。说到读CSV，这可是个稳妥的“表格”格式。你直接拿文本编辑器敲三行：id、name、grade，再跟着填好数据存成shuju1.csv就行。如果想手动用Python写，就得记住这几个关键操作：导入csv模块，用open函数打开文件时别忘带newline=''参数防止空行。接着就是用writer对象写标题行和数据行，最后别忘了关闭文件指针。用Pandas读起来就更省事了，直接调read_csv函数往里一丢，路径里要是有中文还得加open包起来。打印出来的DataFrame会自动把列名对齐。要是想让id变成索引列，就在后面加index_col='id'。文件要是用制表符分隔的话，就换成pd.read_table()并指定sep='\t'。 TXT格式其实也没那么干净。你照着刚才那个例子改改，把逗号换成问号？保存成shuju2.txt。读的时候也得小心，直接用read_table函数加sep='\s+'，这里的\s+能匹配所有的空白符。要是分隔符乱七八糟的，还可以把sep参数换成re.compile(r'\s+')正则表达式来帮忙。数据清理完了，咱们得把这“新生”给存下来。不管是CSV还是其他格式的，都可以调df.to_csv()。默认用逗号分隔，还会带着索引列名一起导出。你要是想用竖线或者制表符隔开也行，方便其他工具看。最方便的是加个index=False参数，这样生成的out3.csv就不会有多余的索引列名了。别光看代码不动手啊，实践才是硬道理！这方法虽然不能说是“银弹”，但足够应付日常的导入、清洗和导出了。把这些小坑都踩平了，以后在文本分析这块儿也就稳了。