有时候需要在本地导入一些stage环境的数据到本地mysql,面对1000+的sql文件(包含表结构和数据,放在同一个文件夹下),使用navicat一个一个导入sql文件显然有点太慢了,于是考虑使用source命令批量来实现。网上看了很多人遇到这个高频的数据库sql导入问题,但是没有特别具体的解决方案,只有个大概的思路,我就抛砖引玉,作为一个详细的记录,渡人渡己。
先复习一下source的使用方法,首先要用命令行方式连接到MySQL数据库,然后使用下面的命令:
use database_name1切换到需要被使用的数据库,然后再使用如下命令:
source path/to/file/table_name1.sql本质上就是要使用这行命令来将sql文件的内容导入database_name1库里。使用source对上G大小的sql文件非常高效和丝滑,不会出现图形化界面导入的时候的卡顿或者崩溃。
但是多个sql文件(比如上千个)那么就需要source很多次,还是回到最初的问题,如何能一次性批量source进去呢?
这个时候可以想着创建一个完成批量导入的sql文件,假设命名为batch.sql,里面的内容大概如下:
source /path/to/file/table_name1.sql source /path/to/file/table_name2.sql source /path/to/file/table_name3.sql ... 省略900多行 source /path/to/file/table_name1000.sql人工的去编写这个batch文件显然费力,但是我们现在目标明确了,就是要想办法实现生成这样的batch.sql文件。
可以考虑使用脚本程序来实现,把这个问题转换成一个简单的脚本任务:
对指定路径的文件夹下所有文件名进行收集,并且是每个文件的全路径+文件名写入一个新的sql文件里面。当然别忘了每行开头要添加一个source命令,一个文件单独一行。
用Python实现最简单,os.walk可以用于遍历文件夹下的文件夹和文件,get_source_batch_file.py实现如下。
这里只处理当前目录下的文件,不会收集子目录下的文件,所以最外层的循环第一次完成后就return结果了。
然后调用部分也很简单,脚本传入第一个参数就是文件夹的路径:
可以看出接收参数也做了入参的路径补全的吹,同样也可以不传参数,默认值就是我们需要处理的文件夹的全路径,之所以接收入参是为了日后使用更加灵活。
最后在终端使用命令如下:
python3.7 get_source_batch_file /Users/tony/pythonwork/test/leetCode > ./batch.sql执行完成后在当前目录下就会生成需要的batch.sql。
所以方法总比困难多,没有现成的工具,我们自己写一个就OK了!