Python如何提取chm数据

 

Python提取chm数据

需求场景

chm格式文档中的内容,提取保存为html

  • 方法一 使用在线转换工具或者软件
  • 方法二 脚本编译

step 1:.bat脚本反编译

使用该脚本, 可以将chm文件反编译,类似解压,获取文件。有些文档可以直接转换为txt,有些会转化为html. 这个跟生成chm文件有关系。

1 新建txt文档, 参照示例写入命令。保存后文件另存为.bat格式

hh -decompile 转换结果输出路径 待转换文件(相对/绝对路径)
# 示例
hh -decompile  D:\Desktop\ 123.chm

2 右键 管理员身份运行该文件即可,结果输出到命令指定的目录

step 2: html转txt

【html】Python提取html中文本到txt

 

查用python自带的.chm官方文档

1.去python的官方网站去下载对应版本的python,在这里下载的python会自带一份官方文档(根据操作系统选择的不同,会有不同的格式),下载windows版本的会有一个(*.chm)格式的说明文档

如何查用python自带的.chm官方文档

如何查用python自带的.chm官方文档

下载好后进入下载目录,找到Doc目录,进入

我的是windows系统,可以看到有个5-6兆的(*.chm)说明文档

windows下可以直接双击打开。

如何查用python自带的.chm官方文档

打开后的样子,可以看到很多目录,充满了知识,等待着去发掘。

如何查用python自带的.chm官方文档

如果我对python自带的某个库的使用十分不解,比如copy,

我应该这样查

如何查用python自带的.chm官方文档

如何查用python自带的.chm官方文档

如何查用python自带的.chm官方文档

想找python基本的数据类型以及使用来学习

可以这样来找

如何查用python自带的.chm官方文档

python自带的(内建的)函数有很多,了解一下

如何查用python自带的.chm官方文档

python自带了的各种异常,快来捕获吧

如何查用python自带的.chm官方文档

python语言是一种解释型语言,很大程度上解决了跨平台开发的难度,关于python的各种接口(interface)调用,以及对操作系统的支持,都可以查到。

如何查用python自带的.chm官方文档

关于英语的问题,大可不必担心,有道云翻译提供截屏翻译,鼠标取词翻译,是十分方便的,快去学习吧!

如何查用python自带的.chm官方文档

如何查用python自带的.chm官方文档

 

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程宝库

 一、前言卷起来好吧,元旦已经过了,就开始写文章模式了。这篇文章会对完全数的各种侦测进行详细解释。写作不易,支持一波~ 二、完全数是什么1、定义老规矩,先来了解完全数是什么。完全数,又称 ...