# ------------------------------------------------------------ # 小説サイト定義 name: &name ハーメルン domain: syosetu.org top_url: https?://\\k<domain> url: - \\k<top_url>/novel/(?<ncode>\d+) - https?://novel.syosetu.org/(?<ncode>\d+) encoding: UTF-8 confirm_over18: no append_title_to_folder_name: yes title_strip_pattern: null cookie: over18=off sitename: *name version: 1.0 # ------------------------------------------------------------ # 目次取得設定 toc_url: https://syosetu.org/novel/\\k<ncode>/ subtitles: |- (?:<tr><td colspan=2><strong>(?<chapter>.+?)</strong></td></tr>)?<tr bgcolor="#.+?" class="bgcolor\d"><td width=60%><span id="(?<index>\d+?)"> </span> <a href=.+? style="text-decoration:none;">(?<subtitle>.+?)</a></td><td><NOBR>(?<subdate>.+?)(?:<span title="(?<subupdate>.+?)改稿">\(<u>改</u>\)</span>)?</NOBR></td></tr> href: \\k<index>.html error_message: 投稿者が削除、もしくは間違ったアドレスを指定しています|この作品は投稿者によって削除されました|この作品は完全非公開設定です|この小説は非公開設定になっています # ------------------------------------------------------------ # 本文取得設定 body_pattern: |- <span style="font-size:120%">.+?</span><BR><BR> (?<body>.+?) (?:<div id=atogaki><BR><HR><BR>(?<postscript>.+?)</div>)? introduction_pattern: <div id=maegaki>(?<introduction>.+)<BR><HR><BR></div> postscript_pattern: null illust_current_url: null illust_grep_pattern: <a href="(?<src>.+?)" alt="挿絵" name='img'>【挿絵表示】</a> # ------------------------------------------------------------ # 小説情報からパースするための設定 novel_info_url: https://syosetu.org/?mode=ss_detail&nid=\\k<ncode> # タイトル t: タイトル</td><td bgcolor=#FFFFFF><a href=.+?>(?<title>.+?)</a> # novel_type 小説種別 nt: 話数</td><td>(?<novel_type>.+?) .+?話</td> novel_type_string: 連載(連載中): 1 連載(未完): 1 連載(完結): 3 短編: 2 # general_all_no 掲載話数 ga: 話数</td><td>.+? (?<general_all_no>\d+)話</td> # story あらすじ s: "あらすじ</td><td colspan=3 bgcolor=#FFFFFF>(?<story>.+?)</td>" # general_firstup 初回掲載日 gf: 掲載開始</td><td>(?<general_firstup>.+?)</td> # novelupdated_at 小説の更新時刻 nu: null # general_lastup 最終掲載日 gl: 最新投稿</td><td>(?<general_lastup>.+?)</td> # writer 作者名 w: 作者</td><td bgcolor=\#FFFFFF>(?:<a href=.+?>)?(?<writer>.+?)(?:</a>)?</td> # length 文字数 l: 合計文字数</td><td>(?<length>.+?)文字