htmlの要素一覧からタグの部分だけ抽出 正規表現 スクレイピング

 

<div>

<section>

<article>

<aside>

<nav>

<header>

<footer>

<main>

<fieldset>

<ul>

<ol>

<li>

<dl>

<table>

<thead>

<tbody>

<tfoot>

<tr>

<td>

<th>

<span>

<a>

<label>

<mark>

<strong>

<em>

<br>

<hr>

<img>

<input>

<meta>

<link>

<base>

<area>

<source>

<track>

<li>

<dt>

<dd>

<caption>

<thead>

<tbody>

<tfoot>

<tr>

<td>

<th>

<option>

<optgroup>

<legend>

<summary>

<address>

<details>

<summary>

<dialog>

<figure>

<figcaption>

<abbr>

<bdi>

<bdo>

<cite>

<code>

<pre>

<kbd>

<s>

<samp>

<small>

<sub>

<sup>

<time>

<audio>

<video>

<canvas>

<embed>

<object>

<param>

<picture>

<svg>

<source>

<track>

<button>

<datalist>

<optgroup>

<output>

<progress>

<meter>

<select>

<textarea>

<legend>

<noscript>

<script>

<style>

<template>

<slot>

<shadow>

<isindex>

<slot>

<template>

<acronym>

<applet>

<bgsound>

<big>

<blink>

<center>

<font>

<marquee>

<ruby>

<rt>

<rp>

<slot>

<template>

<shadow>

<plaintext>

<xmp>

<listing>

<math>

<mrow>

<mi>

<mn>

<mo>

<msup>

<msub>

<mfrac>

<msqrt>

<munder>

<mover>

<svg>

<circle>

<rect>

<line>

<polygon>

<polyline>

<path>


コメント