AS07 各題疑問 #57
Unanswered
YuXiangLin1234
asked this question in
Q&A: Assignments
Replies: 2 comments 2 replies
-
|
想同問第一題,我目前是假設每對commentor會重複出現所寫的code(跑了兩層迴圈) 有參考過前幾篇文把執行階段類型改成GPU後也還是出現了那段文字 |
Beta Was this translation helpful? Give feedback.
2 replies
-
|
推一下,想知道到底怎麼算,感覺 Sample Output 很奇怪... |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment

Uh oh!
There was an error while loading. Please reload this page.
Uh oh!
There was an error while loading. Please reload this page.
-
老師您好:
我對各題的題目描述都有問題想請教:
第一題
第一題題幹敘述是:「只要在同一則貼文的comments內,我們把任兩個commentor視為有co-comment,也就是Cooccurrence(共現)的關係。請計算出共現於本資料集中,頻率最高的前20對commentor(必須印出Collocation times作為參考)。」
而老師給的參考答案為:
我有兩個疑問:
s72005ming sl11pman 450與sl11pman s72005ming 450)第二題 Using MI
p(兩commentor共同出現)與p (此commentor出現)的機率,我目前的想法是:p(此兩commentor共同出現) = 此兩commentor共同出現在同篇文章次數 / 所有兩共同出現在同篇文章的 commentor 對出現次數總和p(此commentor出現) = 此commentor發表的評論數總和 / 總評論數總和但按照這樣思路寫出來的輸出卻與標準答案相差甚遠,因此想詢問可能是哪邊理解錯誤?
第三題 Cooccurrence with distance
題目敘述為「就上述的資料集,我想定義的人與人的關係是「這兩個人老是一前一後出現」,所以我規劃僅計算前後5則以內的comments,也就是說,在同一貼文中,如果A是第一則comment,B是第六則comment,C是第七則,那我不列計A和C的關係,但列計A和B的關係。請用collocation with distance的觀念,計算任兩個comment間的平均距離,並用most_comment()列印出平均距離最短的前二十對commentors。」
這題的標準答案為
我有一些問題:
1.這題是否要直接接續上兩題做,因為上兩題的 commentor 對 會按照排列的順序不同而出現兩次(像是
xm32 ap543 2.000000與ap543 xm32 2.000000),但這題沒有,所以我們是要重新弄一個counter來處理distance嗎?2. 題目說要找出平均距離最短的20組,但我看標準答案好像是從長的排到短的,所以我們應該是要先篩出20組最短的再讓他從長的排到短的嗎? 或是其實是用
most_common(20)找出最長的20組?(因為我目前寫出來的數字都跟解答不同,所以我也沒辦法測試哪樣會跟答案一樣QQ)再麻煩老師回覆了,謝謝~
Beta Was this translation helpful? Give feedback.
All reactions