G4專題主題詢問 #42
chiawen0104
started this conversation in
Q&A: Courses & Projects
Replies: 1 comment 4 replies
-
|
(1) 之前2016, 2017有一個很有名的案例是做AppleDaily Donation,但文本探勘找不出什麼東西來,反而是哪位記者寫的文章,預測上比較有效。但嘖嘖募資沒有這樣的特性,要去想說他有什麼樣的variable或attribute可以用。然後會受不同的募資案的影響很大。因為「文本關鍵字」聽起來很合理,但事實上,對募資文本而言,什麼該是他的關鍵字,定義是很模糊的。但可以在explore多一點,這是為什麼請你們要先了解資料的緣故,需要知道你們會把資料的什麼變項拿進來用。 (2) 這看似有關聯,但小說情節和dcard感情版貼文人工都匹配不來,機器應該是非常難匹配的。但如果是偵測哪些句子或者片段是很小說的,這似乎頗有趣的。但要用什麼方法偵測呢? |
Beta Was this translation helpful? Give feedback.
4 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
Uh oh!
There was an error while loading. Please reload this page.
-
老師好,我們是G4,目前想到的主題有兩個,分別是:
(1)嘖嘖募資平台的介紹文案對募資成效的影響:尋找文本關鍵字,文案如何撰寫才會提高募資成功率
(2)小說情節與dcard感情版貼文的關聯性:分析dcard感情版貼文與小說情節關鍵字的匹配程度,觀察與熱門程度的關聯
主要透過python爬蟲來分析文本,希望能跟老師討論問題點與可行性來決定主題,想詢問老師有空討論的時間,謝謝老師。
Beta Was this translation helpful? Give feedback.
All reactions