Skip to content

tmu-nlp/RSS_arxiv

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

RSS_arxiv

arxiv cs cl RSS からいい感じに新着をとってくるスクリプト

概要図

fig

取ってくる内容物

  • title
  • author
  • url
  • abstract
  • area info

abstract について

普通に取ってくると長いので以下の2種類で要約した

  • TextRank
  • lead-3

config

HOME 以下に yaml format で置く

  • _arxiv_ntfy.yml: config 例、log path だけ変えてください
  • url: slack webhook url
  • abst_type: textrank or lead-3
  • time_log: log path (feed time が入ってくる)
  • exec_log: log path (logging が入ってくる)

webhook url について

参考記事とかで探してください
git とかに直書きしないように(1敗)

requirements

  • feedparser
  • slackweb
  • nltk
  • gensim
  • pyyaml (yaml)

Note

  • arXiv の更新タイミング例: <pubDate>Tue, 18 Jun 2019 00:30:00 GMT</pubDate> -> JST 9:30

参考

About

arXiv の新着をゲットするアレ

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages