小説を読もう!オフラインリーダーのデータって基本的には本文テキストのみなんだけど、2018年以降くらいのデータは1行がhtmlのp要素に包まれてるんだけど、取り出すときにこれは自動で消した方がいいよな?

予定的にはこんな感じのフォルダ構造で出力する予定。
小説タイトルフォルダ
 ┣infoフォルダ
 ┃┗小説自体の更新情報やエピソードの更新情報など
 ┗連番付きのあらすじ・本編テキスト

テキスト自体は
ヘッダー
ページURL
ncode
シリーズURL
scode
作者ページURL
作者ID
投稿日時
更新日時

作者名
シリーズ
小説タイトル

本文

みたいな感じにしたいと思ってるけどどうだろう?
infoフォルダには小説や本文を除いたエピソードデータ、既読情報を置く予定。

意見を聞きたい。