DS工具生成测试数据(2)

#coding:utf-8
import os
print("generate query sql")
for i in range(1,100):
    tpl = "query"+str(i)+".tpl"
    qsql = "query" +str(i) +".sql"
    #拼接命令
    cmd = "./dsqgen  -DIRECTORY ../query_templates/ "+"-TEMPLATE "+tpl+" -DIALECT netezza -FILTER Y > "+"../sql/"+qsql
    #print(cmd)
    #执行命令
    os.system(cmd)

去sql目录下查看刚才生成的SQL:

DS工具生成测试数据

这种情况下还是shell更快一点。

5、总结

通过TPC-DS,可以生成指定量级的数据。

碰到报错不要慌,先google或bing,不要用某度,原因你懂的。

TPC-DS基本用法已经总结完了,但是实际操作中还有很多问题,比如:

我想要生成10T数据怎么搞?

怎么判断生成的数据是否正确呢?

child和parallel怎么使用?

数据和SQL生成完了怎么测试?

。。。。。。

Linux公社的RSS地址https://www.linuxidc.com/rssFeed.aspx

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/87aca0c7bdd4ac244ea6e891a75b5c76.html