近来学习了一点LaTeX, 感觉功能尤其强大。为了督促自己, 也为了让LaTeX更好地服务于工作,输出格式相同的记录文件,我打算开发一个脚本来完成这个工作。

已实现的功能:

  • 根据现有模板将普通文件生成基本的、合法的LaTeX源码,目前完成的有:
    • 生成目录和基本信息。
    • 替换的元字符有 ‘_’,更多的LaTeX元字符正在收集中。
    • 对置于{}中的网址实现链接转换。
    • 对每行中位于冒号(:)前的文字做超链接转化。
    • 引入显示源代码的模块, 超链接模块,颜色显示模块。
  • 由用户交互式选择是否编译和有无必要重复编译。

待实现的功能:

  • 用户自定义链接的内容和格式。
  • 增加丰富的颜色显示,统一给数字、用户指定的特殊字符施加颜色。
  • 扩大识别方式,用户给定文字模板和LaTeX模板,自动拟合,扩大应用范围。
  • 能处理数学公式。
  • 增加命令行选项,方便定制参数;实现从文件读取参数设置,避免重复输入。
  • 修正Overfull \hbox warning, 通常由不能正确断行引起,需手动指定断行点,设计由程序根据日志信息自己处理这些事务。
  • 根据日志信息由程序决定是否要多次编译,这个是LaTeX本身的问题。
  • 实现文件内的标签设定、交叉链接。可能需要处理LaTeX源码两次。

目前实现方式:
基于python的re(正则表达式)模块来解析文本模板,在合适的位置添加适当的LaTeX标签。

希望能形成几个通用模块,或借助更好的模块来完成这个工作。

或许可以参考plastex