编程知识 cdmana.com

Conversion HTML et markdown de Python

PythonDehtmlAvecmarkdownConversion mutuelle

Préface

TyporaIl est facile demdExporter soushtml,J'ai toujours eu l'idée dehtmlRevenir àmarkdown,J'ai donc organisé plusieurs méthodes sur Internet,Pour une utilisation ultérieure.

Si vous convertissez un seul fichier,Conversion directe en ligne recommandée:Link Link Link

1. html2text

pip install html2text

Code de conversion:

import html2text

md_text = open('ret.html', 'r', encoding='utf-8').read()

markdown = html2text.html2text(md_text)

with open('make2.md', 'w', encoding='utf-8') as file:
    
    file.write(markdown)
    

2. html2markdown

pip install html2markdown

Code de conversion:

import html2markdown

md_text = open('ret.html', 'r', encoding='utf-8').read()

markdown = html2markdown.convert(md_text)

with open('make3.md', 'w', encoding='utf-8') as file:
    
    file.write(markdown)

Après avoir testé html2text La conversion des modules est également !

3. pandoc

pip install pandoc

Ouvrir dans le Répertoire à convertir cmd

Oui.mdConvertir enHTML:

pandoc -f markdown -t html -o a.html a.md

HTMLConvertir enmd:

pandoc -f html -t markdown -o b.md b.html

Insérer la description de l'image ici

Insérer la description de l'image ici

4. Traitement par lots

Conversion simultanée de plusieurs fichiers ,Exemple de code:

htmlTourne.md:

import os

path = r'Chemin du fichier'
all = os.listdir(path)
for file in all:
    if file.endswith('.html'):
    	name = os.path.splitext(file)[0]
        os.system('cd {} && pandoc -f html -t markdown -o {}.md {}.html '.format(path, os.path.splitext(name)[0], os.path.splitext(name)[0]))
""" @Author: ZS @CSDN : https://zsyll.blog.csdn.net/ @Time : 2021/11/25 12:36 """
import html2text
import os

for root, dirs, files in os.walk(r'E:\PythonInformation', topdown=True):
    for name in files:
        path = os.path.join(root, name)
        if path.endswith('.html'):
            with open(path, encoding='utf-8') as html, open(os.path.join(root, os.path.splitext(name)[0] + '.md'), 'w', encoding='utf-8') as md:
                markdown = html2text.html2text(html.read())
                md.write(markdown)

                print(os.path.splitext(name) + ' Conversion réussie!')

RÉFÉRENCESLlink Link


Allez!

Merci beaucoup.!

Un effort.!

版权声明
本文为[Zsyl]所创,转载请带上原文链接,感谢
https://cdmana.com/2021/11/20211125174627529n.html

Scroll to Top