HTML形式のデータを取得し、タグ情報をすべて削除してまっさらなテキストにしたい。
通常は、htmlの内容のタグの中身をtextcontentsなどで、取得すればhtmlが取り除かれた内容が取得できますが、状況によってはそれができない場合があります。例えばhtmlメールをデータで取得し、それを加工して特定の情報を抜き出したいなどです。

Class指定されてない、ID指定されていないよくわからない?(笑)コードの規則性を発見し、それにあったコードを書いて中身を取り出す。
そんな場面が実際多く存在します。

こんな方に

PowerAppsを使って、メールを取得し、その内容を加工してExcelに吐き出したい方。
Google Spreadsheetを使って、Gmailの内容を取得し、加工してGoogle Spreadsheetに書き込みたい方。
HTMLのデータだとよくわからないから、毎回タグを削除して送信してと誰かに言われている方。

正規表現をつかった解決方法

まず、htmlDataの中に、データを取得して入れます。その後、この正規表現を使うとすべてのタグをreplaceし、中身だけを綺麗に吐き出して、StringDataの中に保管してくれます。

Excelだとtypescriptで使えます。GoogleだとGoogle Apps Scriptで使用できます。正規表現は、いろいろなスクリプトで共通のフォーマットなので、入れ方されわかれば、だいたい使えます。


Amazonで購入したおすすめ商品

お疲れ様です。パソコン仕事は体を痛めます。
長時間のパソコン仕事で、肩や目が痛い方はこちらがおすすめです。
快適な環境で仕事をしたいですね。


肩が上がらない。姿勢が悪くなる。
腕を広げてタイピングできるので、肩への負担が軽減されます。

目の奥が痛い!時に。
画面の色を損なうことなく、パソコンを長時間見るときに役立ちます。
見た目はエッジが効いている?ので、集中モードの時に。

ネットが遅くて困る!接続数足りてる?
パソコン・スマホ・タブレットを80台まで接続できてこの値段。