Home  >  Q&A  >  body text

扩展 - 如何在Python中调用C++代码或Java包中的函数

最近非常纠结的一个问题:我所用的机器的操作系统是64位Windows 7,使用Python 3对微博文本进行处理,现在面对的一个大问题就是如何使用分词工具NLPIR和Stanford大学的开源句法分析Java包Stanford Parser进行文本处理。
经过我的搜索,大概有三方面的思路:

  1. 使用Python内建的工具创建Python扩展
  2. 使用SWIG

但很明显,我不知道具体应该怎么做?希望有大牛来给个指引!谢谢!

天蓬老师天蓬老师2765 days ago466

reply all(2)I'll reply

  • ringa_lee

    ringa_lee2017-04-17 11:16:22

    可以用Python的扩展来实现。可参考Extending Python with C or C++。

    Python本来是C实现的,封装二进制兼容的C++是很容易的。

    Java的话得通过JNI来实现,就是说在Python扩展里用C调用Java。

    另外,你也可以写一个TCP服务来包装C++/Java的接口,通过网络来调用,这样更通用。

    reply
    0
  • 大家讲道理

    大家讲道理2017-04-17 11:16:22

    我再补充一些:

    对于 C++,除了 Python 官方的文档所述和 SWIG,可选的方案还有 Cython、boost.python 和 SIP 等。

    对于 Java,PyLucene 包含了一个名叫 JCC 的代码生成器,同时可以为 JNI 生成适用于 C++ 和 Python 的必要代码。(不过对这个东西的靠谱度我不是很了解)

    再补充

    我赞同 @felix021 最后一个观点,并且更进一步,不一定需要做成服务,作为独立进程去调用也可以。每个部分尽可能专注实现一件事,算是比较符合 Unix 哲学的。特别的,虽然你提到的两个库我不熟悉,但是从用途来看,它们不大可能是非常迅速微秒级别的运算,这样,使用另一个进程来操作并不会有太大的性能影响。

    reply
    0
  • Cancelreply