#coding:utf-8
import os
print("generate query sql")
for i in range(1,100):
tpl = "query"+str(i)+".tpl"
qsql = "query" +str(i) +".sql"
#拼接命令
cmd = "./dsqgen -DIRECTORY ../query_templates/ "+"-TEMPLATE "+tpl+" -DIALECT netezza -FILTER Y > "+"../sql/"+qsql
#print(cmd)
#执行命令
os.system(cmd)
去sql目录下查看刚才生成的SQL:
这种情况下还是shell更快一点。
5、总结
通过TPC-DS,可以生成指定量级的数据。
碰到报错不要慌,先google或bing,不要用某度,原因你懂的。
TPC-DS基本用法已经总结完了,但是实际操作中还有很多问题,比如:
我想要生成10T数据怎么搞?
怎么判断生成的数据是否正确呢?
child和parallel怎么使用?
数据和SQL生成完了怎么测试?
。。。。。。
Linux公社的RSS地址:https://www.linuxidc.com/rssFeed.aspx