ChessPdfBrowser

创建ChessPdfBrowser应用程序是为了解决国际象棋玩家的功能差距:

将PDF书中的国际象棋游戏转换为标准.pgn格式,任何可靠的国际象棋应用程序都可以使用。

它有一个个人chesspdfbrowser网站网站

说明说明

您可通过该申请:

  • 从 PDF 书籍中提取游戏 。
  • 通过游戏变量导航 。
  • 从多个页面提取图表 。
  • Identify positions (image ->妇女论坛)。
  • Trabajar con con el formato estándar de partidas.pgn 片段
  • 与.richPgn格式合作,该格式已经丰富,包括了PDF互动的信息。
  • PDF与仪表板之间的相互作用
  • 与UCI发动机(如种群鱼)连接
  • 播放计时游戏游戏

一般特征:

  • 多种语言
  • 可配置多分辨率缩放
  • 暗模式选项
  • 用户手册

代码描述

应用程序在爪哇编程,图书馆按模块组织。


游戏的最突出功能是提取游戏, 其最突出的功能是基于一个分析器, 该分析器将词汇分析器与合成分析器结合起来

此剖析器的初始版本使得能够以多种语言的代数符号提取游戏游戏Name

从版本 v1.26 到版本 v1.26, 允许用代数符号表示碎片来提取游戏

此新函数是通过增强现有的游戏解析器来开发的, 以包含一个将片段图像翻译为相应首字母的层 。

使用 K= 1 的近邻算法实施了图像对首版翻译器

笔译员根据错误计量标准,从所设置的标签示例中选择最接近的选项。


版本 1. 20 引入的另一个有趣的特征是位置识别。 应用程序试图通过分析棋盘图像来确定位置的 FEN 字符串 。

这一功能基于我购买的IEEE文章中的理论,以供参考:

  • 其目的是通过探测方形,确定棋盘上的方形位置。
  • 如果成功, 应用程序会遍历所有方块, 并尝试辨别每个方块。 如果一个方块是空的, 应用程序将尝试用最近的邻居算法来识别该方块 。
  • 如果成功地确定了所有方形,则假定也成功地确定了董事会。
  • 如果用户无法识别所有方块,应用程序将用公认的方块显示董事会,并要求填写更多实例,以完全识别董事会。

当游戏从 PDF 中提取时, 校对者会使用已知位置的图像进行自我训练, 这有助于学习用片段识别方形


第1.20版引入了一个新的功能,提取游戏meta数据,包括播放器名称、ELO评级、日期和地点。

This feature utilizes a system of regular expressions that accommodates various metadata formats I encountered during testing.


在v1.20中增加的另一个有趣的特征是,可以选择连接到UCI类发动机,如种群鱼。

我为此功能开发了一个通用引擎配置。 它读取连接时的引擎配置, 并生成一个用户修改引擎选项的表格 。


在V1.26版中,增加了支持从数字中提取代数符号游戏。


自版本 1.30 以来,应用程序包含一个新的二进制, 允许您从. pgn 文件创建 PDF, 有两个选项: 一个图形界面应用程序, 或者一个命令行应用程序选项, 以使进程自动化 。


版本v1.33增加了对与扫描的PDFs合作的支持。

视窗窗

ChessPdfBrowser v1.0 (2016)

下载下载

ChessPdfBrowser v1.1 (2019)(2019)

下载下载

ChessPdfBrowser v1.11 (2019)(2019)

下载下载

ChessPdfBrowser v1.36 (2026)

下载下载

版本版本

image

Chess PDF Browser 是一个在 Java 中编程的应用程序, 允许您以 PDF 格式浏览象棋帐簿 。

它还能够使用.pgn格式的游戏文件工作。

查看可以浏览不同游戏的棋盘。

允许您打开 PDF 象棋簿和提取游戏,以.pgn 格式保存。

允许您编辑存储在内存中的游戏变量,无论是从.pgn 读取,还是从 PDF 中提取,还是直接通过移动棋盘上的片段创建的。

有一个综合综合手册 详细描述应用程序是如何运作的 。

image

一些错误已被固定, 并在最新版本的应用程序中添加了新功能 :

  • 新的实验游戏提取器。
  • 标记为新事物 。 (新事物) 。
  • 增加了俄语语言支持。

有一个全面综合指南》综合指南 来解释应用程序是如何运作的。

image

用户指南已随着应用程序的新版本而更新。

有一个全面综合指南》综合指南 来解释应用程序是如何运作的。

image

随着最新版的应用程序,增加了许多新的特点:

  • 实验性细列项目提取器已被一个新的提取器所取代,该提取器现在考虑到方括号和方括号。
  • 该系统现在有能力提取游戏数据,包括播放器名称和ELO排名。
  • 能够以代数符号查看游戏中的动作 。
  • 已实施OCR, 以识别董事会职位, 并将这些职位添加到不从标准起点开始的游戏中。
  • 现在你们可以对着另一个人或一个引擎玩游戏,或者对着两个引擎玩游戏。

  • 增强与 UCI 引擎的连接:
    • 修改引擎设置, 例如, 降低播放级别, 降低比最大级别低的级别 。
    • 对各职位的分析。
    • 完整的游戏分析。
    • 您可以在游戏中使用引擎作为玩家 。
  • 暗模式选项

有一个全面综合指南》综合指南 来解释应用程序是如何运作的。

image

应用程序的新版本现在可以使用数字代数符号从 PDF 中提取游戏移动 。

这个版本有什么新内容:

  • 该软件允许以数字代数符号提取游戏,记录碎片的移动情况。
  • 使用光学字符识别(OCR)增强板位置识别。
  • 有些虫子已经被修好了

有一个全面综合指南》综合指南 来解释应用程序是如何运作的。


您可以看到新功能的视频 演示视频

image

The new version includes improvements in position detection (image ->费恩)

image

新版本包含一个新的二进制, 允许您从 Pgns 创建 PDF 。

您可以在此链接中找到 演示视频 新功能中的功能

image

新版本添加了与扫描的PDFs合作的选项


当我使用代码处理 PDF 时, 选项是使用 pdfbox 来操作 PDF 细节 。

但我不喜欢商业逻辑的理念 明确使用这种依赖性, 所以我决定创建一个PDF接口 提供功能, 并编程一个实施程序, 利用了 pdfbox 库


其缺点是,对于纯扫描的PDFs(没有任何人加入文本),图书馆无法归还与扫描页有关的文本。

因此,应用程序无法提供从扫描的PDF中提取条目的功能。


此新版本现在允许您尝试从扫描的 PDF 中提取条目 。

之所以能够做到这一点,是因为设计了一个新的PDF接口实施程序,试图利用现有的pdfbox实施,提供与“正常”PDF功能相当的功能。

这个新的图书馆内部使用pdfbox来获取扫描页面的图像,每页都引用云层中的外部OCR。

由于以这种方式实时工作将极为缓慢(每页使用OCR需要3至10秒),图书馆每页只使用一次OCR。

一旦援引OCR,结果被保存到档案系统,随后申请需要它的时间,从那里检索。


结果是,新图书馆与纯的pdfbox图书馆具有等同和可互换性,为“正常”PDFs和扫描PDFs提供了等同功能。

虽然缺点是,OCR提供的文本承认不如从“正常”PDFs中提取的文本完美。


对于提取游戏, 应用程序已经提供了一个机制, 允许您选择将“ l” 更改为“ 1”, 将“ S” 更改为“ 5 ” 。

对于扫描的PDF,还添加了一些新的翻译(将“英镑”改为“f”),这些翻译是固定的,没有用户干预。

这些性格转变极大地改善了流动的提取。

抽取游戏的结果并不完美,但可以抽出一些动作的顺序,通过编辑游戏,只要稍稍忍耐,可重新组合分解游戏。


您可以在此链接中找到 演示视频 新功能中的功能

image

创建这一版应用程序的目的是改进应用程序,以便从国际象棋游戏中获取最佳最佳结果。马德里共同体共同分享的象棋PDF


第一次试图抽取这些游戏有点灾难性,因为PDF的特征在应用程序中没有说明:

  • PDF 游戏的动作没有明确区分捕捉( i.e. 捕捉显示没有“ x ” 。 例如 : “ ed4 ” 而不是 “ exd4 ” ) 。
  • 最后游戏图中还有一个特征,其中数字的样式似乎与PDF的其余部分有很大不同,导致应用程序无法自动培训自己。 甚至是手动培训,因为我正试图将所有贴有标签的例子都纳入同一模型中。
  • 应用程序中可用的任何布局探测器都没有正确检测到带有图表的页面布局。

考虑到这些问题,我试图找到一个解决办法:

  • 应用程序现在接受明确的抓取符号, 但不盲目依赖它们。 它允许没有这些符号, 并且是在确定移动的起源和目的地方块时, 才能最终确定移动是否是一个抓取符, 将其适当写入保存的. pgn 文件 。
  • 还添加了管理位置识别模型更多细节的选项, 允许您选择一个特定选项或创建一个新选项, 手动培训识别器在识别失败时的位置 。
  • 此外,现在有可能用新的窗口来管理模型,删除模型或配置更多的模型细节。
  • 增加了两种新的布局探测器,专门用于图解提取。

在调试从 PDF 中提取游戏时, 我发现一些错误,

(抱歉,应用程序没有单位测试, 当先前工作过的功能损坏时, 检测起来并不容易)


固定的虫子与定位探测有关(自动定位识别中断)。

与发现(N)新事物有关的问题也已经解决,以及其他一些问题,以改进其他一些特征的功能。

此外,还努力改进图像与象棋位置的识别,用于检测既不是GROWTH型也不是OCR型的布局,将图像位置标识与这两个布局探测器的图像位置标识等同起来。


我认为,这个最新版本是迄今为止最精炼的应用程序版本。

视频视频

Descargas