数据备份工具 BackupSerenity V2.1 新增 CSV 导入工具集


数据备份工具 BackupSerenity V2.1 新增CSV导入工具集

CSV导入工具集

作用:将将包含表头的CSV文件批量导入至MYSQL

使用方式:

启动脚本

nohup python3 csv_input_mysql.py > csv_input_mysql.log &
生成的文件名称 csv_input_mysql.log 可以根据情况修改如果想保留全部日志可以将 > 替换为 >> 即可

导出错误日志

cat csv_input_mysql.log | grep '创建失败' > csv_input_mysql.log.ERR

获取全部CSV文件名称 [成功]

cat csv_input_mysql.log | grep '正在疯狂处理' | awk '{print $2}' > csv_files.list

获取全部表名称 [成功]

cat csv_input_mysql.log | grep '创建成功' | awk '{print $2}' > table_names.list

数据验证

源数据无法预估质量,会出现源数据换行等情况,此时可以使用清洗工具进行清洗,清洗后即可进行验证

通过数据导入程序进行导入程序后对原始csv进行清洗
编辑 cleaned_data.py 文件修改

# 清洗前源数据
input_file = 'you_file.csv'
# 清洗后数据
output_file = 'cleaned_you_file.csv'

修改完成后进行执行
python3 cleaned_data.py

执行成功后通过wc命令进行行数获取
wc -l cleaned_you_file.csv

数据库通过
SELECT COUNT(1) FROM you_file

得出的数差值为1

数据验证成功

具体点击原文链接查看,或直接访问 此链接 查看


相關推薦

2024-07-30

数据备份工具 BackupSerenity V2.2 新增 CSV,XLSX/XLS 导入工具集 使用场景:在使用数据库时会有批量数据导入的场景,数据源可能人工生成的XLS表格或者是别的系统导出的CSV V2.2 更新内容: wip - 🕔 新增:XLSX文件批量导入工具集 wip

2023-11-29

BackupSerenity V2.1 发布 - 开源数据库备份思路整合工具-容器编排一键部署 本次实现使用Docker-compose快速部署运行,新增Nginx 查看备份结果。将原有 30min-1h 的部署过程,提升至 3min 内完成,大幅提升部署效率 Ⅱ V2.1 开发进度 开发

2023-11-08

: 新增判断当前环境是否为docker的逻辑和函数 新增backupserenity 控制主程序 实现docker容器化封装,运行 修复错误功能: 去除容器内crontab 定期任务逻辑 修复docker exec 无法调度 提示exit 1的问题 解决systemd 无法在容

2022-11-05

不多需要100个小时,需要通过分布式多机备份提升性能 数据备份的一致性,分布式数据库天然物理多节点分布,基于分布式的一致性快照做备份是基本诉求。传统基于分布式事务的SELECT查询获取一致性快照,采用逻辑数据导出

2023-09-29

K. - 合并主分支发布Releases === 程序说明 开源软件 BackupSerenity MySQL 数据库备份工具 核心原理:通过 go 封装的一套基于 MySQL 备份的思路工具…… 作者: heike07 开源PHP收录软件链接:https://www.oschina.net/p/backupserenity Github

2023-08-19

通知:Backup_Tools 数据库备份软件 正式更名为 BackupSerenity backup 备份 serenity 宁静 意为 宁静的备份…… 是一个回馈开源的MySQL数据库备份工具~ 对此录制了该软件的视频讲解,已经上传至B站,感谢大家支持! Backupserenity

2022-06-06

的单元格 修复了查看器中文档溢出的重置 修复了 CSV 导入中更新现有单元格的问题 在 CSV 导入中增加了对 orgchart 布局的支持 更新 AWS 修复了 sketch 主题中不一致的菜单 修复了导入嵌入式 SVG 时忽略 XML 数据的问题 修复

2022-09-12

该版本具体更新内容如下: 新功能 在条目对话框的工具菜单中增加了 Copy Initial Password(复制初始密码)命令;它复制(到剪贴板)打开对话框时的密码 当选择多个条目(至少包含一个附件)时,附件的数量现在显示在条

2023-01-06

系统数据;最后,我们增加了完整数据包括规则和配置的导入导出功能,支持节点的迁移。另外,我们也修复了一些问题,并发布到 1.7.x 版本中。 12月的版本发布包括: v1.8.0-alpha.3:包含 1.8.0 已开发完成的新功能 v1.7.4

2023-07-26

增 | 采集插件 这次,我们为您带来了全新的商品采集工具,让您的商品上架工作变得更加高效 该插件,支持采集多个主流电商平台的商品信息 包括Alibaba、Lazada、Amazon、Aliexpress、京东、淘宝、天猫、1688   购买方式: 1

2024-06-29

和 SQL Server 类型的数据源以“文件模式”上线,本期新增对 MySQL 数据源类型的支持。 该模式参考了数据库客户端执行 SQL 脚本的方式。使用文件模式,您可以直接将能够在数据库客户端执行的 SQL 脚本通过 SQLE 平台进行上

2023-01-04

讯云 CHDFS 和 百度智能云 BOS、AFS 上的数据。 #15297 #15448 新增函数 新增函数 substring_index。 #15373 问题修复 修复部分情况下,从 1.1.x 版本升级到 1.2.0 版本后,用户权限信息丢失的问题。 #15144 修复使用 date/datetimev2 类型进行

2023-05-09

DBeaver 是一个免费开源的通用数据库工具,适用于开发人员和数据库管理员。 DBeaver 23.0.4 发布,更新内容如下: Data Editor: 底部工具栏变得可定制 断开的编辑器可以很容易地重新连接起来 修复了 Ctrl+1 快捷键不起作用

2023-01-19

增强功能。SQLiteStudio 是一个跨平台的 SQLite 数据库的管理工具。 具体更新内容包括: ADDED:#4653 为了处理小分数,现在有一个选项可以将这些数字的网格视图表示更改为科学记数法 - 该选项位于 Configuration/Data Browsing 中。 C