学号 2017035107077
姓名 许国玮
仓库 https://gitee.com/xgwlogs/assignment_three
打开、读取文档并将文档存储到buffer里面,执行完毕后关闭文档
from string import punctuation
def process_file(dst):
try:
f = open(dst)
except IOError as s:
print (s)
return None
try:
bvffer = f.read()
except:
print (\"Read File Error!\")
return None
f.close()
return bvffer
将buffer内的数据进行切片,去掉符号空格,用for循环进行统计,将统计数据存储在word_freq并返回值
def process_buffer(bvffer):
if bvffer:
word_freq = {}
for item in bvffer.strip().split():
word = item.strip(punctuation+\' \')
if word in word_freq:
word_freq[word] += 1
else:
word_freq[word] = 1
return word_freq
将统计好的数据进行排序并输出前十个数据
def output_result(word_freq):
if word_freq:
sorted_word_freq = sorted(word_freq.items(), key=lambda v: v[1], reverse=True)
for item in sorted_word_freq[:10]:
print (item)
程序运行命令
if __name__ == \"__main__\":
import argparse
parser = argparse.ArgumentParser()
parser.add_argument(\'dst\')
args = parser.parse_args()
dst = args.dst
bvffer = process_file(dst)
word_freq = process_buffer(bvffer)
output_result(word_freq)
结果
反思:或许是刚接触吧 对git的运用不是很熟练,有时间多找点资料看一下他的基础知识和运行方法
希望以后可以灵活运用