deephub

腾讯云

开发者社区

文档建议反馈控制台

首页TVP

LV1

发表了文章 4天前2024-05-10 17:29:43

OpenAI宣布与Stack Overflow合作开发 OverflowAI，帮助技术人员快速找到问题的解决方案

OpenAI 与 Stack Overflow 宣布了一项新的 API 合作伙伴关系，此举将利用 Stack Overflow 作为全球领先的高技术内容知识平台...

deephub 4天前2024-05-10 17:29:43

stack、解决方案、开发者、openai、overflow

发表了文章 4天前2024-05-10 15:50:28

10个使用NumPy就可以进行的图像处理步骤

图像处理是一种数学计算。数字图像由称为像素的彩色小点组成。每个像素由红、绿、蓝(RGB)三个独立的颜色组成。每个像素中的主色由每个RGB分量的数值决定。

deephub 4天前2024-05-10 15:50:28

图像处理、numpy、block、image、size

发表了文章 4天前2024-05-10 15:30:09

Gradformer: 通过图结构归纳偏差提升自注意力机制的图Transformer

这是4月刚刚发布在arxiv上的论文，介绍了一种名为“Gradformer”的新型图Transformer，它在自注意力机制中引入了指数衰减掩码。以下是主要创新...

deephub 4天前2024-05-10 15:30:09

论文、模型、数据、效率、性能

发表了文章 4天前2024-05-10 14:59:33

使用PyTorch实现L1, L2和Elastic Net正则化

在机器学习中，L1正则化、L2正则化和Elastic Net正则化是用来避免过拟合的技术，它们通过在损失函数中添加一个惩罚项来实现。

deephub 4天前2024-05-10 14:59:33

模型、数据、pytorch、torch、函数

发表了文章 4天前2024-05-10 14:58:51

整合文本和知识图谱嵌入提升RAG的性能

我们以前的文章中介绍过将知识图谱与RAG结合的示例，在本篇文章中我们将文本和知识图谱结合，来提升我们RAG的性能

deephub 4天前2024-05-10 14:58:52

知识图谱、编码、模型、索引、性能

发表了文章 4天前2024-05-10 14:57:32

论文推荐：用多词元预测法提高模型效率与速度

这是4月发表的论文《Better & Faster Large Language Models via Multi-token Prediction》，作者们...

deephub 4天前2024-05-10 14:57:32

论文、模型、数据、效率、性能

发表了文章 4天前2024-05-10 14:56:53

号称能打败MLP的KAN到底行不行？数学核心原理全面解析

前几天火爆的Kolmogorov-Arnold Networks是具有开创性，目前整个人工智能社区都只关注一件事LLM。我们很少看到有挑战人工智能基本原理的论文...

deephub 4天前2024-05-10 14:56:53

数学、原理、变量、函数、论文

发表了文章 4天前2024-05-10 14:56:11

循环编码:时间序列中周期性特征的一种常用编码方式

在深度学习或神经网络中，"循环编码"（Cyclical Encoding）是一种编码技术，其特点是能够捕捉输入或特征中的周期性或循环模式。这种编码方法常用于处理...

deephub 4天前2024-05-10 14:56:12

算法、编码、对象、模型、数据

发表了文章 4天前2024-05-10 14:55:18

LSTM时间序列预测中的一个常见错误以及如何修正

当使用LSTM进行时间序列预测时，人们容易陷入一个常见的陷阱。为了解释这个问题，我们需要先回顾一下回归器和预测器是如何工作的。预测算法是这样处理时间序列的:

deephub 4天前2024-05-10 14:55:19

数据、lstm、range、size、测试

发表了文章 4天前2024-05-10 14:54:33

LLM2Vec介绍和将Llama 3转换为嵌入模型代码示例

嵌入模型是大型语言模型检索增强生成(RAG)的关键组成部分。它们对知识库和用户编写的查询进行编码。

deephub 4天前2024-05-10 14:54:33

模型、设计、数据、性能、论文

发表了文章 4天前2024-05-10 14:53:40

BiTCN：基于卷积网络的多元时间序列预测

在时间序列预测领域中，模型的体系结构通常依赖于多层感知器(MLP)或Transformer体系结构。

deephub 4天前2024-05-10 14:53:40

模型、数据、网络、变量、函数

发表了文章 14天前2024-04-30 17:44:11

贝叶斯推理导论：如何在‘任何试验之前绝对一无所知’的情况下计算概率

从左至右依次为托马斯·贝叶斯、皮埃尔-西蒙·拉普拉斯和哈罗德·杰弗里斯——逆概率(即现在所说的客观贝叶斯分析)发展中的关键人物。[24]

deephub 14天前2024-04-30 17:44:11

性能、测试、量化、数据、统计

发表了文章 14天前2024-04-30 17:43:22

如何准确的估计llm推理和微调的内存消耗

Command-R+， Mixtral-8x22b和Llama 3 70b都在最近的几周内发布了，这些模型是巨大的。它们都有超过700亿个参数:

deephub 14天前2024-04-30 17:43:22

存储、模型、内存、优化、LLM

发表了文章 14天前2024-04-30 17:42:30

通过学习曲线识别过拟合和欠拟合

如果一个模型对数据进行了过度训练，以至于它从中学习了噪声，那么这个模型就被称为过拟合。过拟合模型非常完美地学习了每一个例子，所以它会错误地分类一个看不见的/新的...

deephub 14天前2024-04-30 17:42:30

数据、性能、变量、函数、模型

发表了文章 14天前2024-04-30 17:41:37

2004年4月计算机视觉论文推荐

本文将整理4月发表的计算机视觉的重要论文，重点介绍了计算机视觉领域的最新研究和进展，包括图像识别、视觉模型优化、生成对抗网络(gan)、图像分割、视频分析等各个...

deephub 14天前2024-04-30 17:41:37

论文、模型、视频、数据、计算机视觉

发表了文章 18天前2024-04-26 13:34:07

常用的时间序列分析方法总结和代码示例

时间序列是最流行的数据类型之一。视频，图像，像素，信号，任何有时间成分的东西都可以转化为时间序列。

deephub 18天前2024-04-26 13:34:07

title、变量、函数、数据、set

发表了文章 18天前2024-04-26 13:33:28

苹果开源高效语言模型系列 OpenELM，分为4个大小270M、450M、1B和3B

苹果公司最新推出系列高效开源的语言模型 OpenELM，包括OpenELM-270M、OpenELM-450M、OpenELM-1_1B和OpenELM-3B不...

deephub 18天前2024-04-26 13:33:29

模型、苹果、数据、性能、开源

发表了文章 18天前2024-04-26 09:17:40

微软Phi-3，3.8亿参数能与Mixtral 8x7B和GPT-3.5相媲美，量化后还可直接在IPhone中运行

Phi-3是一系列先进的语言模型，专注于在保持足够紧凑以便在移动设备上部署的同时，实现高性能。Phi-3系列包括不同大小的模型：

deephub 18天前2024-04-26 09:17:40

iphone、gpt、量化、模型、数据

发表了文章 18天前2024-04-26 09:15:41

Barnes-Hut t-SNE:大规模数据的高效降维算法

在数据科学和分析中，理解高维数据集中的底层模式是至关重要的。t-SNE已成为高维数据可视化的有力工具。它通过将数据投射到一个较低维度的空间，提供了对数据结构的详...

deephub 18天前2024-04-26 09:15:41

数据、算法、效率、优化、数据可视化

发表了文章 18天前2024-04-26 09:15:06

5种搭建LLM服务的方法和代码示例

在不断发展的大型语言模型（LLMs）领域中，用于支持这些模型的工具和技术正以与模型本身一样快的速度进步。在这篇文章中，我们将总结5种搭建开源大语言模型服务的方法...

deephub 18天前2024-04-26 09:15:06

部署、服务、服务器、模型、LLM

12 3 4 5 6 7 8...70 下一页

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2020-04-20

个人成就

获得 3.2K 次赞同
文章被阅读 1.5M 次
文章获得 1 次首页推荐

关注了：1关注者：172