HTML形式のデータを取得し、タグ情報をすべて削除してまっさらなテキストにしたい。
通常は、htmlの内容のタグの中身をtextcontentsなどで、取得すればhtmlが取り除かれた内容が取得できますが、状況によってはそれができない場合があります。例えばhtmlメールをデータで取得し、それを加工して特定の情報を抜き出したいなどです。

Class指定されてない、ID指定されていないよくわからない?(笑)コードの規則性を発見し、それにあったコードを書いて中身を取り出す。
そんな場面が実際多く存在します。

こんな方に

PowerAppsを使って、メールを取得し、その内容を加工してExcelに吐き出したい方。
Google Spreadsheetを使って、Gmailの内容を取得し、加工してGoogle Spreadsheetに書き込みたい方。
HTMLのデータだとよくわからないから、毎回タグを削除して送信してと誰かに言われている方。

正規表現をつかった解決方法

まず、htmlDataの中に、データを取得して入れます。その後、この正規表現を使うとすべてのタグをreplaceし、中身だけを綺麗に吐き出して、StringDataの中に保管してくれます。

Excelだとtypescriptで使えます。GoogleだとGoogle Apps Scriptで使用できます。正規表現は、いろいろなスクリプトで共通のフォーマットなので、入れ方されわかれば、だいたい使えます。