您可通过该申请:
- 从 PDF 书籍中提取游戏 。
- 通过游戏变量导航 。
- 从多个页面提取图表 。
- Identify positions (image ->妇女论坛)。
- Trabajar con con el formato estándar de partidas.pgn 片段
- 与.richPgn格式合作,该格式已经丰富,包括了PDF互动的信息。
- PDF与仪表板之间的相互作用
- 与UCI发动机(如种群鱼)连接
- 播放计时游戏游戏
一般特征:
- 多种语言
- 可配置多分辨率缩放
- 暗模式选项
- 用户手册
创建ChessPdfBrowser应用程序是为了解决国际象棋玩家的功能差距:
将PDF书中的国际象棋游戏转换为标准.pgn格式,任何可靠的国际象棋应用程序都可以使用。
它有一个个人chesspdfbrowser网站网站
您可通过该申请:
一般特征:
应用程序在爪哇编程,图书馆按模块组织。
游戏的最突出功能是提取游戏, 其最突出的功能是基于一个分析器, 该分析器将词汇分析器与合成分析器结合起来
此剖析器的初始版本使得能够以多种语言的代数符号提取游戏游戏Name
从版本 v1.26 到版本 v1.26, 允许用代数符号表示碎片来提取游戏
此新函数是通过增强现有的游戏解析器来开发的, 以包含一个将片段图像翻译为相应首字母的层 。
使用 K= 1 的近邻算法实施了图像对首版翻译器
笔译员根据错误计量标准,从所设置的标签示例中选择最接近的选项。
版本 1. 20 引入的另一个有趣的特征是位置识别。 应用程序试图通过分析棋盘图像来确定位置的 FEN 字符串 。
这一功能基于我购买的IEEE文章中的理论,以供参考:
第1.20版引入了一个新的功能,提取游戏meta数据,包括播放器名称、ELO评级、日期和地点。
This feature utilizes a system of regular expressions that accommodates various metadata formats I encountered during testing.
在v1.20中增加的另一个有趣的特征是,可以选择连接到UCI类发动机,如种群鱼。
我为此功能开发了一个通用引擎配置。 它读取连接时的引擎配置, 并生成一个用户修改引擎选项的表格 。
在V1.26版中,增加了支持从数字中提取代数符号游戏。
自版本 1.30 以来,应用程序包含一个新的二进制, 允许您从. pgn 文件创建 PDF, 有两个选项: 一个图形界面应用程序, 或者一个命令行应用程序选项, 以使进程自动化 。
版本v1.33增加了对与扫描的PDFs合作的支持。
Chess PDF Browser 是一个在 Java 中编程的应用程序, 允许您以 PDF 格式浏览象棋帐簿 。
它还能够使用.pgn格式的游戏文件工作。
查看可以浏览不同游戏的棋盘。
允许您打开 PDF 象棋簿和提取游戏,以.pgn 格式保存。
允许您编辑存储在内存中的游戏变量,无论是从.pgn 读取,还是从 PDF 中提取,还是直接通过移动棋盘上的片段创建的。
有一个综合综合手册 详细描述应用程序是如何运作的 。
随着最新版的应用程序,增加了许多新的特点:
有一个全面综合指南》综合指南 来解释应用程序是如何运作的。
应用程序的新版本现在可以使用数字代数符号从 PDF 中提取游戏移动 。
这个版本有什么新内容:
有一个全面综合指南》综合指南 来解释应用程序是如何运作的。
您可以看到新功能的视频 演示视频
The new version includes improvements in position detection (image ->费恩)
新版本添加了与扫描的PDFs合作的选项
当我使用代码处理 PDF 时, 选项是使用 pdfbox 来操作 PDF 细节 。
但我不喜欢商业逻辑的理念 明确使用这种依赖性, 所以我决定创建一个PDF接口 提供功能, 并编程一个实施程序, 利用了 pdfbox 库
其缺点是,对于纯扫描的PDFs(没有任何人加入文本),图书馆无法归还与扫描页有关的文本。
因此,应用程序无法提供从扫描的PDF中提取条目的功能。
此新版本现在允许您尝试从扫描的 PDF 中提取条目 。
之所以能够做到这一点,是因为设计了一个新的PDF接口实施程序,试图利用现有的pdfbox实施,提供与“正常”PDF功能相当的功能。
这个新的图书馆内部使用pdfbox来获取扫描页面的图像,每页都引用云层中的外部OCR。
由于以这种方式实时工作将极为缓慢(每页使用OCR需要3至10秒),图书馆每页只使用一次OCR。
一旦援引OCR,结果被保存到档案系统,随后申请需要它的时间,从那里检索。
结果是,新图书馆与纯的pdfbox图书馆具有等同和可互换性,为“正常”PDFs和扫描PDFs提供了等同功能。
虽然缺点是,OCR提供的文本承认不如从“正常”PDFs中提取的文本完美。
对于提取游戏, 应用程序已经提供了一个机制, 允许您选择将“ l” 更改为“ 1”, 将“ S” 更改为“ 5 ” 。
对于扫描的PDF,还添加了一些新的翻译(将“英镑”改为“f”),这些翻译是固定的,没有用户干预。
这些性格转变极大地改善了流动的提取。
抽取游戏的结果并不完美,但可以抽出一些动作的顺序,通过编辑游戏,只要稍稍忍耐,可重新组合分解游戏。
您可以在此链接中找到 演示视频 新功能中的功能
创建这一版应用程序的目的是改进应用程序,以便从国际象棋游戏中获取最佳最佳结果。马德里共同体共同分享的象棋PDF
第一次试图抽取这些游戏有点灾难性,因为PDF的特征在应用程序中没有说明:
考虑到这些问题,我试图找到一个解决办法:
在调试从 PDF 中提取游戏时, 我发现一些错误,
(抱歉,应用程序没有单位测试, 当先前工作过的功能损坏时, 检测起来并不容易)
固定的虫子与定位探测有关(自动定位识别中断)。
与发现(N)新事物有关的问题也已经解决,以及其他一些问题,以改进其他一些特征的功能。
此外,还努力改进图像与象棋位置的识别,用于检测既不是GROWTH型也不是OCR型的布局,将图像位置标识与这两个布局探测器的图像位置标识等同起来。
我认为,这个最新版本是迄今为止最精炼的应用程序版本。