不幸的是,Dataflow SDK并未公开BigQuery通过Dataflow的
BigQueryIOAPI 返回的架构。单独在Dataflow
API中没有“好的”解决方法。
手动定义架构是一种解决方法。
另外,您可以
jobs:query在管道构建时直接通过BigQuery单独查询,然后将其结果传递给
BigQueryIO.Write转换。这可能会产生额外的成本,但是可以通过稍微更改查询以减少处理的数据量来减轻。输出的正确性无关紧要,因为您仅存储模式。
欢迎分享,转载请注明来源:内存溢出
不幸的是,Dataflow SDK并未公开BigQuery通过Dataflow的
BigQueryIOAPI 返回的架构。单独在Dataflow
手动定义架构是一种解决方法。
另外,您可以
jobs:query在管道构建时直接通过BigQuery单独查询,然后将其结果传递给
BigQueryIO.Write转换。这可能会产生额外的成本,但是可以通过稍微更改查询以减少处理的数据量来减轻。输出的正确性无关紧要,因为您仅存储模式。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)