arxiv cs cl RSS からいい感じに新着をとってくるスクリプト
- title
- author
- url
- abstract
- area info
普通に取ってくると長いので以下の2種類で要約した
- TextRank
- lead-3
HOME 以下に yaml format で置く
_arxiv_ntfy.yml
: config 例、log path だけ変えてください- url: slack webhook url
- abst_type: textrank or lead-3
- time_log: log path (feed time が入ってくる)
- exec_log: log path (logging が入ってくる)
参考記事とかで探してください
git とかに直書きしないように(1敗)
- feedparser
- slackweb
- nltk
- gensim
- pyyaml (yaml)
- arXiv の更新タイミング例:
<pubDate>Tue, 18 Jun 2019 00:30:00 GMT</pubDate>
-> JST 9:30