\Users\Project> python project01.py
['항공', '시장', '동향', '이성은', '미국', '달라스', '무역', '관', '년', '미국', '항공', '산업', '총', '시장', '규모', '억', '달러', '전망', '미국', '주요', '바이어', '국산', '제품', '대해', '긍정', '인식', '미국', '항공', '시장', '동향', '년', '미국', '항공', '산업', '총', '시장', '규모', '억', '달러', '전망', '미국', '세계', '최대', '항공기', '제', '조국', '세계', '시장', '약', '점유', '년', '년', '연', '성장', '년', '년', '향후', '년', '연', '성장', '전망', '향후', '년', '항공', '여객', '수송량', '연', '항공', '화물', '수송량', '연', '증가', '전망', '미국', '선진국', '노후', '항공기', '연료', '효율', '새', '항공기', '교체', '추진', '중이', '이', '수요', '발생', '항공', '산업', '크게', '민간', '군용', '때', '민간', '항공', '산업', '년', '에서', '년', '로', '점유', '율', '증가', '전', '세계', '항공기', '수요', '전망', '자료', '미국', '내', '주요', '항공', '기업', '등', '자료', '과', '추가', '국방', '예산', '수혜자', '듯', '트럼프', '대통령', '년', '억', '달러', '규모', '추가', '국방', '예산안', '구상', '중이', '이', '중', '절반', '전투기', '전함',
...
'켄터키주', '루이스빌', '자료', '홈페이지', '달라스', '무역', '관', '자료', '종합', '저작권', '해외', '시장', '뉴스']
def tag_counting(file):
f = open(file, "r")
lines = f.read()
from konlpy.tag import Twitter
nlpy = Twitter()
nouns = nlpy.nouns(lines)
from collections import Counter
count = Counter(nouns)
tag_count = []
tags = []
for n, c in count.most_common(100):
dics = {'tag': n, 'count': c}
if len(dics['tag']) >= 2 and len(tags) <= 49:
tag_count.append(dics)
tags.append(dics['tag'])
for tag in tag_count:
print(" {:<14}".format(tag['tag']), end='\t')
print("{}".format(tag['count']))
print("\n---------------------------------")
print(" 명사 총 {}개".format(len(tags)))
print("---------------------------------\n\n")
return tags
tags = tag_counting(file = "blog.txt")
print(tags)