Download Scenario JSON

459

838

909

...

新京报

DataOutput Trigger Website EventFormatting Rss

新京报网络版。其中过滤了某些版面,可自行修改。由于排序的原因,增加了最后两个Agent,如果不需要排序,可删除。

Agent Event Flow a244495161661559876 新京报 #9 输出排序后的RSS a6596113514780265489 新京报 #6 过滤无用版面 a8404314205316513 新京报 #7 输出RSS a6596113514780265489->a8404314205316513 a6828376362605785782 新京报 #2 抓取版面目录 a7215971353035865675 新京报 #3 抓取文章目录 a6828376362605785782->a7215971353035865675 a258058108074637701094 新京报 #4 抓取全文 a7215971353035865675->a258058108074637701094 a61997107200297842 新京报 #5 清理版面字段格式 a61997107200297842->a6596113514780265489 a258058108074637701094->a61997107200297842 a9488572351073112070494 新京报 #1 抓取最新一期地址 a9488572351073112070494->a6828376362605785782 a1888645067612727261 新京报 #8 获取前一个RSS(为了排序) a1888645067612727261->a244495161661559876

新京报 #9 输出排序后的RSS (DataOutputAgent)

true
false


新京报 #6 过滤无用版面 (TriggerAgent)

86400
true
false


新京报 #2 抓取版面目录 (WebsiteAgent)

every_5h
432000
true
false


新京报 #5 清理版面字段格式 (EventFormattingAgent)

432000
true
false


新京报 #3 抓取文章目录 (WebsiteAgent)

every_5h
432000
true
false


新京报 #1 抓取最新一期地址 (WebsiteAgent)

every_5h
432000
false
false


新京报 #7 输出RSS (DataOutputAgent)

true
false


新京报 #4 抓取全文 (WebsiteAgent)

every_5h
432000
true
false


新京报 #8 获取前一个RSS(为了排序) (RssAgent)

every_2h
604800
false