lmmp.net
当前位置:首页 >> python怎样读取文本文件里的中文 >>

python怎样读取文本文件里的中文

这个 #在Windows 环境下 import sys reload(sys) sys.setdefaultencoding("utf-8") import re fin = open('in.txt', 'r') #以读的方式打开输入文件 for eachLine in fin: #按行读入文件内容 line = eachLine.strip().decode('gbk', 'utf-8') #处...

codecs模块提供了一个open函数,可以以指定好的编码打开一个文本文件 import codecs with codecs.open("文件路径",encoding='utf-8') as fp: data = fp.read() print data

file = open('filename.txt','r') text = file.read() #读取所有文字 text = file.readline() #读取一行文字 text = file.readlinse() #把每一行变成list的一个元素 如果需要里面中文的话,用正则匹配

Python 读写文本文件首先需要注意的是,txt文件是具有字符编码的,不同的txt字符编码可能不同。具体是什么编码,可以用 notepad++ 等文本编辑器查看。 读取文件建议使用 with...as... 结构,可以自动关闭文件。 with open("text.txt", "r") as f...

$ python3Python 3.2.3 (default, Feb 27 2014, 21:33:50) [GCC 4.6.3] on linux2Type "help", "copyright", "credits" or "license" for more information.>>> import codecs>>> with codecs.open("test.txt", 'r', 'gbk') as handle:... for l...

f = open(filename,mode)#filename,文件路径、名称,如果有\,注意转义或者开头加r,mode读取的模式,r读取,w写入,,read = f.read()#获取内容并储存在变量里f.close()#关闭文件,节省内存

#-*- coding:utf-8 -*-f = open('123.txt', 'r') #文件为123.txtsourceInLines = f.readlines() #按行读出文件内容f.close()new = [] #定义一个空列表,用来存储结果for line in sourceInLines: temp1 = line.strip('\n') #去掉每行最后的换行符...

假设D盘有一个a.txt文件。那么py程序可以如下: # _*_ coding: utf-8 _*_ #上面一行确保utf-8编码,汉字支持。 #下面就是核心语句,用了try-finally确保文件最后被关闭 fileobj = open('D:\\a.txt', 'r') #需要两个\\,或者用原始字符串,在引号...

用beautifulsoup处理啊,去除英文和符号就是中文啦 import rezhongwen=re.sub(r'[\w\/\,=:"\']','',text')

33.txtaaa 1bbb 2ccc 3# _*_ coding:utf-8 _*_char = raw_input('shuru:')dt ={}for i in open('33.txt').readlines(): dt.setdefault(i.strip().split()[0],i.strip().split()[1])if dt.has_key(char): print dt[char]else: print ''

网站首页 | 网站地图
All rights reserved Powered by www.lmmp.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com