本文分类:news发布日期:2024/11/15 14:56:03
相关文章
CCI3.0-HQ:用于预训练大型语言模型的高质量大规模中文数据集
摘要
我们介绍了 CCI3.0-HQ,它是中文语料库互联网 3.0(CCI3.0)的一个高质量500GB子集,采用新颖的两阶段混合过滤管道开发,显著提高了数据质量。为了评估其有效性,我们在不同数据集的100B tokens上从头开始…
建站知识
2024/11/15 14:55:02
Spring Boot 中 Druid 连接池与多数据源切换的方法
Spring Boot 中 Druid 连接池与多数据源切换的方法
在Spring Boot项目中,使用Druid连接池和进行多数据源切换是常见的需求,尤其是在需要读写分离、数据库分片等复杂场景下。本文将详细介绍如何在Spring Boot中配置Druid连接池并实现多数据源切换。
一、…
建站知识
2024/11/15 14:45:51
Seata 分布式事务管理全解析
1. Seata 简介
1.1 什么是 Seata
Seata(Simple Extensible Autonomous Transaction Architecture)是一个开源的分布式事务解决方案,旨在解决分布式系统中跨多个服务或数据库的事务一致性问题。由阿里巴巴于 2019 年开源,Seata 的…
建站知识
2024/11/15 14:44:50
ThreadPool - 线程池技术
1. 池化思想 池化思想(Pooling)是一种资源管理策略,其核心思想是重用资源以减少开销和提高效率。在计算机科学中,池化思想被广泛应用于多种资源的管理,包括但不限于线程、数据库连接、网络连接、内存块等。
池化思想的…
建站知识
2024/11/15 14:36:41
《线性代数》学习笔记
列向量无关
上个星期继续学线性代数,一个矩阵,如何判断它是的列向量有几个是线性无关呢?其实有好几个方法。第一个就是一个一个判断。
先选定一个,然后看下这两个,怎么看呢?如果两个列向量线性相关&#…
建站知识
2024/11/15 14:35:40