python查看与改变文件的编码格式
查看文件的编码格式
with open(r"C:\Users\Administrator\Desktop\111\2.1 (1)smile.txt", 'rb+') as fp:
content = fp.read()
print(chardet.detect(content)) #{'encoding': 'UTF-8-SIG', 'confidence': 1.0, 'language': ''}
修改文件的编码格式
with open(r"C:\Users\Administrator\Desktop\111\2.1 (1)smile.txt", 'rb+') as fp:
content = fp.read()
encoding = chardet.detect(content)['encoding']
content = content.decode(encoding).encode('utf8') # 修改为utf-8格式
fp.seek(0)
fp.write(content)
print(chardet.detect(content)) #{'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}
案例:修改编码格式并且把所有的txt都整合成一个txt
import os
import chardet
def saveFile(filename, content):
f = open(filename, "w", encoding="utf-8")
f.write(content)
def readFile(filename):
f = open(filename, "r", encoding="utf-8")
return f.read()
def file_extension(path):
return os.path.splitext(path)[1]
def combinetxt(rootdir, filename):
print(rootdir,filename)
f = open(filename, "w", encoding="utf-8")
list = os.listdir(rootdir)
for i in range(0, len(list)):
path = os.path.join(rootdir, list[i])
if os.path.isfile(path):
if file_extension(path) == ".txt":
content = readFile(path)
# f.write("*****************************")
f.write(content)
f.close()
if __name__ == '__main__':
# 打开文件
path = r"C:\Users\Administrator\Desktop\111\弄好的"
dirs = os.listdir(path)
# 输出所有文件和文件夹
for file in dirs:
filepath = path + "\\" + file
with open(filepath, 'rb+') as fp:
content = fp.read()
encoding = chardet.detect(content)['encoding']
content = content.decode(encoding).encode('utf8')
fp.seek(0)
fp.write(content)
outfile = "rest.txt"
combinetxt(path, outfile)
python查看与改变文件的编码格式 相关文章
【Python】 爬虫
---------------例子1-------------- import requests import os from bs4 import BeautifulSoup headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'}
python-----删除列表中某个元素的3种方法
python中关于删除list中的某个元素,一般有三种方法:remove、pop、del: 1. remove: 删除单个元素,用小括号()删除首个符合条件的元素,按值删除 举例说明: str=[1,2,3,4,5,2,6] str.remove(2) str [1, 3, 4, 5, 2, 6] 2. pop: 删除单个或多个元素,按位删
linux查看端口
linux查看端口占用情况 /wangtao1993/p/6144183.html 原文包括一个检测端口占用情况的python小程序 Linux如何查看端口 1、lsof -i:端口号 用于查看某一端口的占用情况,比如查看8000端口使用情况,lsof -i:8000 # lsof -i:8000COMMAN
linux查看网络配置的命令
tracert命令的格式为:tracert [-d][-h maximum_hops] [-j host-list][-w timeout] [-R][-S srcaddr] [-4][-6] target_name。 ①、-d 表示不将地址解析成主机名。 ②、-h maximum_hops 表示搜索目标的最大跃点数。 ③、-j host-list 表示与主机列表一起的松
我用Python合成大西瓜!
这周五没漂亮妹妹带我出去玩了呜呜,无聊在家扣手机,发现大家都在合成大西瓜 。作为一个未来年轻无为的计算机科学家(或许是人民艺术家),我是不屑于玩这种浪费时间又无聊的游戏的(因为玩了四小时才合成了第一个大西瓜),但为了投身到人民群众中去,我决
天啦噜!Python多线程居然是骗人的
Python解释执行原理 我是一个Python线程,我的工作就是解释执行程序员编写的Python代码。 之所以说是解释执行,是因为Python是高级语言,CPU那家伙不认识Python代码,需要运行的时候动态翻译成CPU指令。 我把Python源代码经过“编译”以后,变成了一个个的字
Python学习第十天
异常处理 Python提供了异常处理机制,可以在异常出现时及时捕获,并且进行处理。 单个except结构 try: a = int(input('请输入第一个整数: ')) b = int(input('请输入第二个整数: ')) result = a / b print('结果是', result)except ZeroDivisionError: print
Python中的字典
字典 字典是映射的一种体现 映射是表示一种键(索引)和值(数据)之间的对应 键值对:键是数据索引的拓展 字典是键值对的集合,键值对之间没有顺序 键值对采用大括号{}和dict()创建,键值对内部用冒号:表示 {键1:值1,键2:值2,......,键n:值n} 在字典变
用Python实现粒子群算法(PSO)
粒子群算法是一种基于鸟类觅食开发出来的优化算法,它是从随机解出发,通过迭代寻找最优解,通过适应度来评价解的品质。 From 《An Improved PSO Algorithm to Optimize BP Neural Network》 PSO算法的搜索性能取决于其全局探索和局部细化的平衡,这在很大程
python2中 print()中文乱码怎么办
python内部使用的是unicode编码,而外部会用到各种编码,中国最常用utf-8。 python默认会认为源代码文件是ascii编码,ascii编码中不存在中文,遇到中文会抛出异常。 一、声明utf-8编码格式 此时需要在头部声明utf-8编码格式,常用声明方法有这么3种 # coding