当前位置: 首页 > news >正文

7 月 SeaTunnel 社区狂飙:新特性、强优化、贡献者满分输出

🔥 热度不减,代码狂飙!7 月的 SeaTunnel 社区依旧是“满血运转”——数十位小伙伴齐心协力,为项目带来一波猛升级:

💡 功能焕新

  • 新增 Databend、Doris、Presto/Trino 等多款连接器支持
  • ClickHouse 多表写入、HTTP 批量写入、向量化转换等高能特性登场
  • SQL 转换更强大,支持多条件判断、EXTRACT 更多字段等

🔧 稳定性 & 性能升级

  • 优化 Paimon、Iceberg、Kafka、Oracle CDC 等连接器的类型兼容与时区处理
  • 提升 Spark 引擎并行性,增强远程主机验证、异常定位等
  • 修复 CI、打包、线程安全等“隐藏 bug

📚 文档 & 社区建设

  • 多个连接器新增/更新中文文档
  • 官网文档同步到 2.3.11 版本
  • 发布最新安全通知

💪 贡献之星
来自全球的 30+ 位贡献者用代码、文档和测试点亮了 7 月的社区——感谢每一位让 SeaTunnel 更强的你!

月度Merge之星

感谢以下小伙伴上个月为 Apache SeaTunnel 所做的精彩贡献(排名不分先后):

weekly_combined_avatars_2025-07-01

@hawk9821,@CosmosNi,@suntectec,@zhangshenghang,@dailai,@fcb-xiaobo,@Hisoka-X,@jw-itq,@ocean-zhc,@liudechang,@xiaochen-zhou,@itnccuong,@Adamyuanyuan,@e-mhui,@SEZ9,@misi1987107,@hailin0,@prclin,@dybyte,@chl-wxp,@Zzih,@liunaijie,
@litiliu,@papadave66,@scienceyang,@emmanuelmoon,@ShuiMu-peng,@hantmac,@corgy-w,
@sohurdc,@joexjx,@mrtisttt,@dyp12,@yzeng1618,@zhilinli123,@WenDing-Y

apache/seatunnel仓库

修复

  • [Fix][Doc]Sink的 plugin_input 配置不正确 @e-mhui
  • [Fix][Connector-V2]优化 Paimon 的 DECIMAL 类型检查以防止精度丢失 @xiaochen-zhou
  • [Fix][Connector-V2]更新批处理模式和只写模式的 waitCompaction 值 @xiaochen-zhou
  • [Fix][Connector-V2]修复 starrocks 小数列定义生成 #9470 @prclin
  • [bugfix][Connector-V2]修复了负载驱动不准确的情况 @chl-wxp
  • [Fix][paimon-e2e]端到端测试错误 @WenDing-Y
  • [Fix][Zeta]修复主节点切换时的操作线程泄漏 @Hisoka-X
  • [Fix][Connector-Iceberg]修复 Iceberg 时间戳类型的时区问题 @yzeng1618
  • [Fix][seatunnel-dist]修复重复依赖项 @litiliu
  • [Fix][Mongo-CDC]修复 mongo 的 ExactlyOnce 默认为 true 导致 room 出现故障的问题 @jw-itq
  • [Bug][Connector-V2]修复 Paimon 中小数类型精度不兼容时的 NPE 问题 @hawk9821
  • [bug][dist]修复发布打包异常 @hawk9821
  • [Fix][Connector-V2]更正批量大小每扫描选项的键中的拼写错误 @corgy-w
  • [Fix][Connector-V2]在 SeaTunnelRow 中设置默认 tableid 以进行 Debezium JSON 反序列化 @corgy-w
  • [Fix][Zeta]将 SeaTunnelTask 中的 parallelStream 改为 stream 以避免类加载器不匹配 @sohurdc
  • [Fix][Connector-V2]Oracle CDC 在启用 LOB 时未更新事务提交 @Hisoka-X
  • [Fix][Transform-V2]日期格式字符串中 'T' 的正确处理 @corgy-w
  • [Fix][Connector-V2]箭头到Seatunnel行读取器转换Seatunnel行值 添加处理第二个TIMESTAMP类型 @dyp12
  • [Fix][Connector-V2]修复 OceanBase Oracle 不支持的数据类型创建 @Hisoka-X
  • [Fix][Connecotr-kafka]修复 Kafka 中偏移量为 -1 时的 IllegalArgumentException @WenDing-Y
  • [Fix][Connector-Http]修复无效的 MIME 类型 @litiliu
  • [Fix][CI]将 iris docker 版本更新为修复 ci @Hisoka-X
  • [Fix][E2E]Kafka的固定端到端测试用例未能按预期工作 @WenDing-Y
  • [Fix][Spark]修复源并行性在 Spark 引擎上无法正常工作的问题 @joexjx
  • [Fix][Connector-V2]修复 Prometheus 检查时间无法解析双精度值 @chl-wxp
  • [Fix][CI]修复更新构建状态操作错误 @Hisoka-X
  • [Fix][Connector-jdbc]修复 PostgreSQL sink 尝试更新唯一键 #9293 @papadave66
  • [Fix][CI]禁用死链检查 @Hisoka-X
  • [Fix][CI]将 continue-on-error 设置为 true 以处理死链任务 @Hisoka-X
  • [Fix][Connector-V2]修复 Hive 客户端线程不安全问题 @corgy-w
  • [Bug][Zeta]SeaTunnelClient 无法带错误退出 @CosmosNi
  • [Fix][Connector-V2]修复构建 ClickHouse 节点时缺失选项配置的问题 @mrtisttt
  • [Fix][CI]从健全性检查中移除死链检查 @Hisoka-X
  • [Fix][Connector-V2]修复 OceanBase MySQL JDBC sink 创建语句错误 @Hisoka-X
  • [Fix][Zeta]修复极端情况下的检查点调度丢失问题 @Hisoka-X
  • [Fix][Transform-v2]修复自定义 UDF 抛出异常 @hawk9821

优化

  • [improve]套接字选项 @liunaijie
  • [Improve]表存储选项 @liunaijie
  • [Improve][Transform-V2]移除不必要的取消引用方法并简化日期解析 @corgy-w
  • [Improve][Connector-V2]支持在upsert会话模式下使用MaxCompute输出写入器进行upsert/删除操作 @dybyte
  • [Doc][Improve]Paimon 支持的投影更新 @WenDing-Y
  • [improve][Connector-V2]删除 JDBC 参数 support_upsert_by_query_primary_key_exist @chl-wxp
  • [Feature][connector-kudu]实现过滤器 @WenDing-Y
  • [Feature][Zeta]将开始时间添加到作业信息中 @hawk9821
  • [improve]TDengine 选项 @liunaijie
  • [improve]Typesense 选项 @liunaijie
  • [Improve][Connector-file]向BinaryReadStrategy添加可配置的二进制块大小支持 @CosmosNi
  • [Feature][Connector-V2][JDBC]添加 presto/trino 语法 @dyp12
  • [Feature][Jdbc]通过正则表达式支持读取多个表 @yzeng1618
  • [feature][connectors-v2]Paimon 中的谓词下推支持 @hawk9821
  • [Improve]JdbcInputFormat nextRecord 抛出异常 TableId @zhilinli123
  • [Feature][Connector-V2]JDBC 支持将 tinyint1 读取为 byte(tinyint) @Hisoka-X
  • [Feature]从 2.3.11 版本升级到 2.3.12 版本 @zhangshenghang
  • [Improve][Oracle-CDC]移除重复的加载表名 @hailin0
  • [Improve][Transform][SQL]支持转换为 TINYINT/SMALLINT @hailin0
  • [Improve][Transform-V2]SQL 转换 EXTRACT 函数支持更多字段 @CosmosNi
  • [Feature][Sink]文件支持新格式:maxwell_json、canal_json、debezium_json #9278 @dyp12
  • [Improve][Connector-V2]修复 paimon 连接器的单词拼写错误 @dailai
  • [Feature][Connector-V2]支持Databend源/目标连接器 @hantmac
  • [Feature][Connectors-V2][Elasticsearch]支持向量变换Sink @SEZ9
  • [Improve][Connector-V2]为FTP数据通道添加远程主机验证选项 @corgy-w
  • [Feature][Connectors-V2]为时间戳开始模式添加结束时间戳 @WenDing-Y
  • [Improve]优化 stop-seatunnel-cluster.sh 中变量处理的健壮性 @mrtisttt
  • [Improve][Oracle-CDC]修复 Oracle 重命名 DDL 事件中缺失的列类型 @hailin0
  • [improve]EasySearch 支持 schema_save_mode/data_save_mode @CosmosNi
  • [Improve]移除无用的 iceberg sink 配置 iceberg.table.config @Hisoka-X
  • [Feature][Connector-doris]添加了不区分大小写的特性 @yzeng1618
  • [Feature][Connector-JDBC]支持将Oracle BLOB数据作为字符串而不是字节读取 @yzeng1618
  • [Improve]在开发分支中删除 release-note.md @Hisoka-X
  • [Feature][Connector-V2]支持 ClickHouse 的多表写入功能 @mrtisttt
  • [Feature][http-Sink]实现HTTP批量写入 @ocean-zhc
  • [improve]Sentry 选项 @liunaijie
  • [improve]sls 命令的选项 @liunaijie
  • [improve]RocketMQ 选项 @liunaijie
  • [Feature][Connector-V2]Iceberg 添加 AWS Glue 元数据存储支持 @itnccuong
  • [Improve][Connector-V2]支持 MaxCompute sink 编写器的 timestamp 字段类型 @dybyte
  • [Improve][Transform-V2]改进 SQL 转换异常以定位错误表达式 @misi1987107
  • [improve]Pulsar选项 @liunaijie
  • [Feature][transform-v2]SQL 转换支持多条件判断函数 @CosmosNi
  • [Feature][Transform]使用 Amazon Titan 和 cohere 嵌入模型支持单次/批量模式的向量化 @SEZ9
  • [Doc][Improve] support chinese [docs/zh/connector-v2/source/MySQL-CDC.md]好的。 @scienceyang
  • [Feature][connector-hive]Hive sink连接器支持覆盖模式 #7843 @Adamyuanyuan

其他

  • [Chore][Core]移除 ConfigBuilder 中无用的参数 @Hisoka-X
  • [Doc]修复链接错误和DynamoDB参数错误 @ShuiMu-peng
  • [Release][2.3.11][connector-change-log]更新连接器变更日志 @zhangshenghang
  • [Doc]将 deepwiki 添加到 README.md #9354 @emmanuelmoon
  • 添加 MongoDB-CDC 连接器中文文档 @liudechang
  • [Doc][zh-CN]添加HiveJdbc连接器的中文文档(#8497) @liudechang
  • [Doc][Connector-V2]更新OssFileSink的保存模式配置 @Zzih
  • [Future][Connector-V2]支持非主键表的自动创建 @hawk9821

apache/seatunnel-website仓库

修复

  • [Fix][Doc]修复 transform-v2 文本标题 @suntectec
  • [Fix][Seatunnel-website]Sink的 plugin_input 配置不正确 @e-mhui
  • [Fix]在 version.js 中使用动态导入代替 execa @zhangshenghang
  • [Fix]修复无法显示的 con @fcb-xiaobo

其他

  • [Release][2.3.11]更新Seatunnel网站文档 @zhangshenghang
  • [NOTICE]更新安全通知 @hailin0
http://www.sczhlp.com/news/10316/

相关文章:

  • 在K8S中,假设一家基于整体架构的公司处理许多产品。现在,随着公司在当今规模化行业中的发展,其整体架构开始引起问题,如何看待公司从单一服务转向微服务并部署其服务容器?
  • GAS_Aura-Post Process Highlight
  • Host startup hook
  • 育儿计划
  • 在请求目标中找到无效字符。有效字符在RFC 7230和RFC 3986中定义处理方式
  • docker run 后报错/bin/bash: /bin/bash: cannot execute binary file
  • Proteus 9.0 SP2 安装使用图文指南 | EDA电路仿真软件
  • Claude Code使用指南
  • C++ 去除字符串中的控制字符
  • 芯片安全标准驱动库,筑牢芯片功能安全基石
  • windows实现键盘记录
  • Linux 安装 Nginx 并配置为开机自启动
  • 在K8S中,有一种情况,公司希望通过保持最低成本来提高效率和技术运营速度,该公司实该如何现这一目标?
  • 基于MATLAB的单目深度估计神经网络实现指南
  • DLL Injection for Notepad
  • 在K8S中,有一家公司想要修改其部署方法,并希望构建一个可扩展性和响应性更高的平台,该公司要如何实现这一目标以满足他们的客户?
  • 记一次 .NET 某汽车控制焊接软件 卡死分析
  • 在K8S中,我们都知道从单服务到微服务的转变从开发方面解决了问题,但在部署方面却增加了问题,公司该如何解决部署方面的问题?
  • 扣子 Coze 产品体验功能
  • 为什么现在的音乐+图片的多媒体形式的感染力这么强
  • 如何排查CPU占用过高
  • 关于网络性能的命令
  • 在K8S中,有一个公司要向具有各种环境的客户提供所有必需的分发产品的方案,如何看待他们动态地实现这一关键目标?
  • 在K8S中,有一家公司希望在从裸机到公共云的不同云基础架构上运行各种工作负载。在存在不同接口的情况下,该公司将如何实现这一目标?
  • Playwright基础入门篇 (1) | 环境搭建与首个自动化脚本
  • 在K8S中,集群服务暴露失败 如何解决?
  • noip2022
  • noip2023
  • csp2023
  • 酷睿Ultra和i系列有啥区别?怎么选看这几点