1. Python を使用して Hive に接続する前に、Hive インストール パッケージの下の lib/py 内のファイルを Python の sys.path 内の site-packages にコピーする必要があります。そうしないと、対応するパッケージを導入するときにエラーが報告されます。これは、Hive Python インターフェイスを使用して Hive クライアントを呼び出すことによって提供されます。
2 hive の thrift を開始します
次のサービスが有効になっていることを確認してください:
hive --service hiveserver
デフォルトのポートは 10000 です
from hive_service import ThriftHive from thrift import Thrift from thrift.transport import TSocket from thrift.transport import TTransport from thrift.protocol import TBinaryProtocol def ReadHiveTest(sql): try: tSocket = TSocket.TSocket('172.18.1.88',10000) tTransport = TTransport.TBufferedTransport(tSocket) protocol = TBinaryProtocol.TBinaryProtocol(tTransport) client = ThriftHive.Client(protocol) tTransport.open() client.execute(sql) return client.fetchAll() except Thrift.TException, tx: print '%s' % (tx.message) finally: tTransport.close() if __name__ == '__main__': showDatabasesSql = 'show databases' showTablesSql = 'show tables' selectSql = 'SELECT * FROM 07_jn_mysql_2' result = ReadHiveTest(selectSql) print(result[1])
以上がPython で Hive に接続して起動する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。