-
Notifications
You must be signed in to change notification settings - Fork 3
/
Copy pathNEWS
267 lines (204 loc) · 9.63 KB
/
NEWS
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
CHANGES IN R VERSION 1.4.4.9000:
BUG FIXES:
* fix append_userdic_meta() (#22)
CHANGES IN R VERSION 1.4.3:
MAJOR CHANGES:
* 사용자 사전 등록의 명사에서 전 품사로 확대 (#22)
- 함수의 이름 변경
- get_userdic_noun() to get_userdic_meta()
- append_userdic_noun() to append_userdic_meta()
CHANGES IN R VERSION 1.4.2:
MAJOR CHANGES:
* 토크나이저 플랜을 조회 시 사용자 사전 지원 (#20)
- get_plan_cost()
MINOR CHANGES:
* 사전의 단어비용 수정 도움말 vignettes에 추가 (#21)
- Manage Dictionary vignettes
CHANGES IN R VERSION 1.4.1:
NEW FEATURES:
* 사전의 단어비용 수정 기능 추가 (#9)
- edit_termcost()
* 사용자 사전 업데이트 기능 추가 (#19)
- update_userdic()
BUG FIXES:
* append_userdic_noun() 중복건 추가 시의 버그 수정 (#17)
* 특정 Linux 환경에서 mecab-dict-index 실행 permission 오류 수정 (#18)
- create_userdic()
CHANGES IN R VERSION 1.4.0:
NEW FEATURES:
* 명사 사용자 정의사전 관리 기능 (#14)
- create_userdic()
* 명사 사전관리 기능 vignettes 추가 (#10)
MAJOR CHANGES:
* 시스템 사전 등록과 사용자 사전 등록의 명시적 구분 (#14)
- add_userdic()을 add_sysdic()으로 변경
- 시스템 사전에 사용자 정의 사전의 추가 기능
- create_userdic()
- 사용자 정의 사전 생성 기능
CHANGES IN R VERSION 1.3.9:
MAJOR CHANGES:
* 단어비용 기반의 플랜 조회 함수에 사전 경로를 지정하는 인수 추가 (#12)
- get_plan_cost()
* 낱말비용 토크나이저 플랜의 중복조회 이슈 수정 (#13)
- get_plan_cost()
CHANGES IN R VERSION 1.3.8:
MAJOR CHANGES:
* 단어비용 기반의 플랜 조회 기능 Windows 지원 (#11)
- get_plan_cost()
CHANGES IN R VERSION 1.3.7:
NEW FEATURES:
* 명사 사용자 정의사전 관리 기능 (thanks to @dataminds, #3, #8)
- 명사 사전 파일 읽어오기
- get_userdic_noun()
- 명사 사전 파일에 인명/지명/고유명사/일반명사 추가하기
- append_userdic_noun()
MAJOR CHANGES:
* 인명사전/지명사전을 추가하는 기능 함수 삭제
- get_userdic_nnp()
- append_userdic_nnp()
- 일반명사 추가하는 기능 함수에 기능 이전
CHANGES IN R VERSION 1.3.6:
NEW FEATURES:
* 사용자 인명사전/지명사전 통합 관리 (#7)
- 고유명사 사전 파일 읽어오기
- get_userdic_nnp()
- 고유명사 사전 파일에 인명/지명 추가하기
- append_userdic_nnp()
MAJOR CHANGES:
* 인명사전 추가하는 기능 함수 삭제
- get_userdic_person()
- append_userdic_person()
- 고유명사 추가하는 기능 함수에 기능 이전
CHANGES IN R VERSION 1.3.5:
NEW FEATURES:
* 단어비용 기반의 플랜 조회 기능 추가 (#4)
- get_plan_cost()
* 인명사전 추가하는 기능의 추가 (#2)
- 인명사전 파일 읽어오기
- get_userdic_person()
- 인명사전 파일에 인명 추가하기
- append_userdic_person()
* 사용자 정의 사전 컴파일 및 설치하기 (#4)
- add_userdic()
CHANGES IN R VERSION 1.3.4:
MAJOR CHANGES:
* bitTA 패키지를 bitNLP로 개명
NEW FEATURES:
* RMeCab 패키지의 collocate(), collScores() 함수 대체 개발 (#9)
- collocate()
- coll_scores()
MINOR CHANGES:
* Text Data Explorer인 explore_docs()에서 RMeCab 패키지 종속성 제거 (#1)
CHANGES IN R VERSION 1.3.3:
MINOR CHANGES:
* tokenize_noun_ngrams() 함수에 mc.cores 인수를 추가하여 사용자가 연산에
사용할 코어를 선택할 수 있도록함 (#32)
- RStudio Cloud 무료 환경은 CPU 자원으로 Core를 1개만 지원하면서 에러가
발생하였는데, mc.cores 인수를 1로 지정하여 에러를 회피할 수 있음
* 설치 에러 발생 수정을 위한 데이터 파일 버전 변경 (#35)
NEW FEATURES:
* 한글의 종성 여부를 체크하는 함수 (#34)
- has_final_consonant()
CHANGES IN R VERSION 1.3.2:
BUG FIXES:
* MS-Windows에서 문자열 조작함수의 에러 발생 오류 수정
(#31, thanks to 송치호 선생님)
- filter_text()
- replace_text()
- concat_text()
- split_text()
- remove_text()
CHANGES IN R VERSION 1.3.1:
NEW FEATURES:
* KNU Korean Sentiment Dictionary를 이용한 감성분석 (#25)
- get_polarity()
* tidytext와 궁합이 맞도록 morpho_mecab() 함수 기능 보완 (#27)
- as_list 인수 추가
BUG FIXES:
* 내장 데이터셋 sentiment_dic의 중복 데이터 제거 (#26)
* Text Data Explorer의 조건 선택 후 텍스트 대체의 오류 수정 (#28)
CHANGES IN R VERSION 1.3.0:
NEW FEATURES:
* 토크나이즈한 명사를 묶어서 문서로 만들어주는 함수 (#8)
- collapse_noun()
* 한글 명사 n-grams 토크나이저 (#8, #10)
- tokenize_noun_ngrams()
* 한글 명사 n-grams 토큰을 tibble에 붙여주는 함수 (#10)
- unnest_noun_ngrams()
* Windows에서 기존에 mecab-ko가 설치되어 있을 경우에 경로를 등록하는 함수 (#15)
- regist_mecab_ko()
* vignettes 추가 (#2)
- Explore Docs
- Morphological Analysis
- Manipulate Documents
- Install bitTA in RStudio Cloud (#20)
* bitTA 로고 개발 및 등록 (thanks to @statkclee-이광춘, #16)
BUG FIXES:
* 대통령 연설문 데이터인 president_speech의 한글 인코딩 오류 수정
* 병렬처리를 위한 문서의 개수가 코어의 개수보다 작아서, 청크의 개수가 0으로
계산되는 오류 해결
- replace_text()
- concat_text()
- remove_text()
- filter_text()
* .GlobalEnv에 데이터 프레임 객체가 하나도 없을 경우에 Docs Explorer 구동과
동시에 발생하는 에러 수정 (#13)
* MS-Windows에서 기존에 mecab-ko가 설치되어 있을 경우에, 이를 인식하지 못하고
에러가 발생하는 오류 수정 (thanks to Kwangchun Lee, #15)
* 인코딩 처리 오류로 morpho_mecab()에서 형태소 분석을 잘못 처리하는
문제의 해결 (thanks to @csh01470, #17)
* president_speech 도움말의 데이터셋 변수 이름 오류 및 vignettes의 변수 이름
수정 (thanks to @sens5900r, #19)
* get_ngrams()에서 "객체 'ngram_delim'를 찾을 수 없습니다" 오류 수정
(thanks to @statkclee-이광춘, #23)
* explore_docs()에서 "객체 'ngram_delim'를 찾을 수 없습니다" 오류 수정
(thanks to @statkclee-이광춘, #23)
* collapse_noun()에서 MS-Windows에서 병렬처리가 불가하다는 오류 수정
(thanks to @statkclee-이광춘, #22)
* tokenize_noun_ngrams()에서 MS-Windows에서 병렬처리가 불가하다는 오류 수정
(thanks to @statkclee-이광춘, #22)
MINOR CHANGES:
* 함수 이름으로 기능을 명확이 유추할 수 있도록 doc_quality()의 이름을
explore_docs()로 변경
* filter_text()에 as_logical 인수를 추가해서 필터링한 단일 문자열 벡터를
반환하거나, 필터링할 대상을 선택하기 위한 논리 벡터를 반환할지를 선택하는
기능을 추가. 논리벡터는 tidytext 패키지와의 협업에 사용. (#14)
CHANGES IN R VERSION 1.2.0:
NEW FEATURES:
* 은전한닢 형태소분석기(mecab-ko)와 사전(mecab-ko-dic)을 사용자 환경에
설치하는 함수 추가 (thanks to @stacklee, #5)
- install_mecab_ko()
- Linix, Mac, Windows 운영체제 지원
* n-gram 토큰화 기능 추가
- get_ngram()
* KOSAC 감성사전 기반의 감성분석
- get_opinion()
* vignettes 추가 (#2)
- Introduce bitTA
- Install mecab-ko (#6)
CHANGES IN R VERSION 1.1.0:
MAJOR CHANGES:
* 형태소분석기를 이용한 토크나이저 함수에서 복수개의 문서에 대해서 복수개의
벡터를 갖는 리스트 객체로 반환
- morpho_mecab()
MINOR CHANGES:
* morpho_mecab() type 인수의 기능 확장
- "noun" : 일반명사(NNG)만 토큰화
- "noun2" : 모든 명사를 토큰화
CHANGES IN R VERSION 1.0.0:
NEW FEATURES:
* 문자열을 분리하는 함수인 split_text() 추가
* 네이버 카페 게시물 스크래핑 샘플 데이터인 buzz 데이터셋 추가
MAJOR CHANGES:
* 함수이름을 카멜 표기법(Camel Case)에서 스네이크 표기법(Snake Case)으로 변경
- from getMeta() to get_meta()
- from getMeta() to get_meta()
- from getMorpHann() to morpho_hann()
- from getMorpMecab() to morpho_mecab()
- from getMorpWise() to morpho_wise()
- from changeStr() to replace_text()
- from concatStr() to concat_text()
- from eraseStr() to remove_text()
- from filterStr() to filter_text()
- from docQuality() to doc_quality()
- from getSpacing() to get_spacing()