本文实例讲述了Python实现统计文本文件字数的方法。分享给大家供大家参考,具体如下:统
本文实例讲述了Python实现统计文本文件字数的方法。分享给大家供大家参考,具体如下:
统计文本文件的字数,从当前目录下的file.txt取文件
# -*- coding: GBK -*-
import string
import sys
reload(sys)
def compareItems((w1,c1), (w2,c2)):
if c1 > c2:
return - 1
elif c1 == c2:
return cmp(w1, w2)
else:
return 1
def main():
fname = "file.txt"
try:
text = open(fname,'r').read()
text = string.lower(text)
except:
print "\nfile.txt is not exist!!! or There is a R/W error! "
sys.exit()
for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_`{|}~':
text = string.replace(text, ch, ' ')
words = string.split(text)
counts = {}
for w in words:
counts[w] = counts.get(w,0) + 1
n = input("\n输入要统计的top单词数:")
items = counts.items()
items.sort(compareItems)
max = len(items)
print "\n单词总计:" + str(len(words))
print "单词净个数(已去重):" + str(max)
print "\n"
if n > max:
n = max
for i in range(n):
print "%-10s%5d" % items[i]
if __name__ == '__main__':
main()
PS:这里再为大家推荐2款非常方便的统计工具供大家参考使用:
在线字数统计工具: http://tools.jb51.net/code/zishutongji
在线字符统计与编辑工具: http://tools.jb51.net/code/char_tongji
Python 统计 文本文件 字数