워드넷을 활용하여 영어 단어 간의 관계성 파악
- 대학원 2학기 전산언어학2 수업의 선택과제로 프로젝트를 진행하였습니다.
- 프로젝트 기간 : 19.09.26 ~ 19.10.10
- 프로젝트 인원 : 2명
- 나의 역할 : 코드작성 및 발표
- 팀원의 역할 : 자료조사 및 ppt작성
- Python 3.7.3
- 워드넷의 정의
- 워드넷은 영어의 거대한 데이터베이스입니다.
- 워드넷은 일종의 영어 어휘집으로 활용됩니다.
- 워드넷의 역사
- 1985년, 언어학자이면서 심리학자인 George Armitage Miller의 주도 하에 프린스턴 대학의 인지 과학 연구소에서 워드넷에 대한 연구가 처음으로 진행되었습니다.
- 1993년, 워드넷이 정식으로 출범하였습니다.
- 워드넷의 데이터베이스
워드넷은 전치사, 관사, 대명사와 같은 기능어들은 제외하고 명사, 동사, 형용사, 부사에 대한 정보만 제공합니다.
워드넷 3.0의 데이터베이스는 아래와 같습니다.
품사 단어의 개수 명사 117,789 동사 11,529 형용사 22,479 부사 4,481
사전 (Dictionary)
예시 보기
Input a word : book >>> book.n.01 : a written work or composition that has been published (printed on pages bound together) ['I am reading a good book on economics'] book.n.02 : physical objects consisting of a number of pages bound together ['he used a large book as a doorstop'] record.n.05 : a compilation of the known facts regarding something or someone ["Al Smith used to say, `Let's look at the record'", 'his name is in all the record books'] script.n.01 : a written version of a play or other dramatic composition; used in preparing for a performance [] ledger.n.01 : a record in which commercial accounts are recorded ['they got a subpoena to examine our books'] book.n.06 : a collection of playing cards satisfying the rules of a card game [] book.n.07 : a collection of rules or prescribed standards on the basis of which decisions are made ['they run things by the book around here'] koran.n.01 : the sacred writings of Islam revealed by God to the prophet Muhammad during his life at Mecca and Medina [] bible.n.01 : the sacred writings of the Christian religions ['he went to carry the Word to the heathen'] book.n.10 : a major division of a long written composition ['the book of Isaiah'] book.n.11 : a number of sheets (ticket or stamps etc.) bound together on one edge ['he bought a book of stamps'] book.v.01 : engage for a performance ['Her agent had booked her for several concerts in Tokyo'] reserve.v.04 : arrange for and reserve (something for someone else) in advance ['reserve me a seat on a flight', 'The agent booked tickets to the show for the whole family', "please hold a table at Maxim's"] book.v.03 : record a charge in a police register ['The policeman booked her when she tried to solicit a man'] book.v.04 : register in a hotel booker []
동의어 (Synonym)
예시 보기
Input a word : good >>> Synonyms : {'sound', 'commodity', 'proficient', 'skillful', 'well', 'dependable', 'trade_good', 'goodness', 'undecomposed', 'thoroughly', 'ripe', 'respectable', 'good', 'honorable', 'soundly', 'expert', 'just', 'safe', 'honest', 'effective', 'full', 'unspoiled', 'near', 'upright', 'secure', 'serious', 'salutary', 'in_effect', 'beneficial', 'estimable', 'adept', 'right', 'in_force', 'practiced', 'skilful', 'dear', 'unspoilt'}
반의어 (Antonym)
예시 보기
Input a word : good >>> Antonyms : {'badness', 'evilness', 'evil', 'ill', 'bad'}
상위어 (Hypernym)
예시 보기
Input a word : car >>> Hypernyms : {'motor_vehicle', 'wheeled_vehicle', 'automotive_vehicle', 'compartment'}
하위어 (Hyponym)
예시 보기
Input a word : vehicle >>> Hyponyms : {'sledge', 'skibob', 'craft', 'rocket', 'bumper_car', 'sleigh', 'sled', 'steamroller', 'Dodgem', 'projectile', 'road_roller', 'military_vehicle', 'wheeled_vehicle'}
부분어 (Meronym)
예시 보기
Input a word : face >>> Meronyms : {'vena_facialis', 'mentum', 'eyebrow', 'nose', 'beard', 'whiskers', 'olfactory_organ', 'chin', 'jaw', 'brow', 'facial_nerve', 'facial_vein', 'supercilium', 'nervus_facialis', 'jowl', 'eye', 'mouth', 'forehead', 'facial', 'lineament', 'seventh_cranial_nerve', 'cheek', 'optic', 'oculus', 'facial_muscle', 'feature', 'face_fungus'}
전체어 (Holonym)
예시 보기
Input a word : finger >>> Holonyms : {'manus', 'paw', 'mitt', 'hand', 'glove'}
함의 (Entailment)
예시 보기
Input a word : snore >>> Entailnemts : {'slumber', "log_Z's", 'kip', "catch_some_Z's", 'sleep'}
부산대와 카이스트에서는 한국어 워드넷 구축을 위해 연구를 진행하고 있습니다.