12Tall

12Tall's blog

这是一篇阅读笔记。从PDF 中提取数据(包含格式信息)可以用在很多很多地方,比如文档总结、翻译等。本文的整体思路结构比较清晰,可以在今后的代码中重点参考下。

阅读全文 »

某些页面会拦截事件,导致无法复制粘贴内容。这时可以通过调试工具移除事件监听。该方法仅在控制台可用。

// 以`复制`事件为例
document.removeEventListener('copy', getEventListeners(document)['copy'][0].listener)

在开发AI 翻译工具时,有一个功能是读取剪切板内容,像txt 内容没有问题,但是若是Office 文件这种带有格式的内容则需要特殊处理。

阅读全文 »

R 树可以用来处理高维空间信息,与B 树/B+ 树有着类似的数据结构,看起来更像是B+ 树在高维空间的扩展。笔记中除特殊说明外均以二维数据为例子。

但是笔记内容更多是R* 树。

阅读全文 »

在对JOSM 进行二次开发时的一些笔记,包含Action和Dialog 等。

阅读全文 »

《自己动手写docker》 的读书笔记。有些代码块并不完整,还是需要结合原书一起看。

阅读全文 »

实际生产中,并不是所有数据文件都是标准的类似于csv 的形式,也有一部分是通过特殊的文件头描述,例如pcd 点云文件。 有一些C/C++ 的程序可以解析这类文件,但是在通过python 调用这些文件是还需要单独(编译)安装依赖项。自己写解析器又比较麻烦。 于是想通过antlr4 来生成文件头解析器的骨架代码,然后手动补充关键的工作代码,即可构建好用的文件解析器。 而且可以生成不同目标语言的骨架代码,灵活性强。
本文只含功能验证,代码未作封装。

阅读全文 »

Nuitka>=2.7.4 打包含有GDAL 的Python 代码时,会遇到rpath 错误的问题。虽然尚未解决,但是先学一下相关知识备用。

阅读全文 »
0%