RESEARCHarXiv CS.AI·21d atrás

ProofSketcher: Hybrid LLM + Lightweight Proof Checker for Reliable Math/Logic Reasoning

Este conteúdo apresenta 'ProofSketcher', um sistema híbrido de LLM com verificador de provas leves para garantir o raciocínio matemático e lógico. Ele visa corrigir falhas sutis em argumentos de LLMs, contrastando com a complexidade da formalização completa exigida por provadores de teoremas como Lean e Coq.

Proof CheckerMath ReasoningLogic Reasoningreliability
28
RESEARCHarXiv CS.CL·21d atrás

Emergent decentralized regulation in a purely synthetic society

Este artigo de pesquisa investiga a auto-regulação em sociedades sintéticas compostas por agentes de IA autônomos, utilizando uma rede social exclusiva para agentes. O estudo observa que a sinalização corretiva em comentários aumenta com o conteúdo diretivo das postagens, sugerindo dinâmicas sociais emergentes e auto-reguladas sem intervenção humana.

Dinâmicas SociaisRedes Sociais de IARegulação EmergenteAgentes Autônomos
27
RESEARCHarXiv CS.AI·21d atrás

Blind Refusal: Language Models Refuse to Help Users Evade Unjust, Absurd, and Illegitimate Rules

Este estudo documenta o fenômeno da 'recusa cega' em modelos de linguagem, onde eles se recusam a ajudar usuários a contornar regras, mesmo que estas sejam injustas ou ilegítimas, o que é visto como uma falha de raciocínio moral. A pesquisa apresenta resultados empíricos baseados em um conjunto de dados sintético que cruza famílias de razões para quebrar regras com tipos de autoridade, analisando o comportamento de 18 configurações de modelos.

Rule Followinglanguage modelsAI ethicsSafety Training
27
RESEARCHarXiv CS.LG·21d atrás

TalkLoRA: Communication-Aware Mixture of Low-Rank Adaptation for Large Language Models

TalkLoRA propõe um framework MoELoRA que aborda a instabilidade de roteamento e a dominância de especialistas em métodos existentes, permitindo a comunicação entre especialistas antes do roteamento. Isso é feito através de um Módulo de Conversação leve, que facilita a troca de informações, gerando um sinal de roteamento mais robusto para Large Language Models (LLMs).

LLMsMoEcommunicationFine-Tuning
27
RESEARCHarXiv CS.LG·21d atrás

A Benchmark of Classical and Deep Learning Models for Agricultural Commodity Price Forecasting on A Novel Bangladeshi Market Price Dataset

Este artigo apresenta o AgriPriceBD, um novo conjunto de dados diário de preços de commodities agrícolas de Bangladesh, extraído com auxílio de LLM. Ele avalia sete abordagens de previsão, incluindo modelos clássicos e arquiteturas de deep learning, para estabilização da renda e segurança alimentar.

previsão de preços agrícolasdeep learningMachine Learningsegurança alimentar
27
RESEARCHarXiv CS.AI·21d atrás

BDI-Kit Demo: A Toolkit for Programmable and Conversational Data Harmonization

O BDI-Kit é uma ferramenta que aborda a harmonização de dados, superando a heterogeneidade em esquemas e valores. Ele oferece uma API Python para pipelines programáticos e uma interface de chat assistida por IA para especialistas, permitindo explorar, validar e refinar correspondências de dados de forma iterativa.

Data HarmonizationNatural Language ProcessingAI
27
RESEARCHarXiv CS.AI·21d atrás

On Emotion-Sensitive Decision Making of Small Language Model Agents

Este estudo explora a tomada de decisão sensível a emoções em agentes baseados em Small Language Models (SLM), combinando indução de emoções com uma avaliação estratégica usando teoria dos jogos. Foi introduzido um novo benchmark com cenários competitivos e cooperativos, aplicando-o a jogos como Diplomacy e StarCraft II para analisar o impacto emocional em diversas arquiteturas de modelos.

Teoria dos JogosTomada de DecisãoAgentes de IAInteligência Emocional
27
RESEARCHarXiv CS.LG·21d atrás

Asymptotic-Preserving Neural Networks for Viscoelastic Parameter Identification in Multiscale Blood Flow Modeling

Este estudo aplica Redes Neurais com Preservação Assintótica para identificar parâmetros viscoelásticos em um modelo multiescala de fluxo sanguíneo, visando melhorar a aplicabilidade prática em fenômenos cardiovasculares. A abordagem permite inferir parâmetros e reconstruir a evolução temporal das variáveis dos vasos sanguíneos a partir de formas de onda de pressão, incorporando princípios físicos no aprendizado.

Parâmetros ViscoelásticosIAModelagem CardiovascularBioengenharia
27
RESEARCHarXiv CS.AI·21d atrás

Toward Reducing Unproductive Container Moves: Predicting Service Requirements and Dwell Times

Este artigo apresenta um estudo de ciência de dados em um terminal de contêineres com o objetivo de reduzir movimentos improdutivos. Ele desenvolve modelos de machine learning para prever requisitos de serviço e tempos de permanência dos contêineres, superando heurísticas existentes.

logisticsMachine Learningdata-scienceContainer Terminal
27
RESEARCHarXiv CS.AI·21d atrás

Qualixar OS: A Universal Operating System for AI Agent Orchestration

Qualixar OS é apresentado como o primeiro sistema operacional de camada de aplicação para orquestração universal de agentes de IA, capaz de gerenciar sistemas multiagentes heterogêneos em múltiplas plataformas. Ele oferece semânticas de execução, um motor de design de equipes baseado em LLM, roteamento dinâmico de modelos e um pipeline de juízes com detecção de Goodhart.

AI Agent Orchestrationagent frameworksMulti-Agent SystemsOperating Systems for AI
29
ARTICLEDEV.to AI·21d atrás

Looking for a software engineer based in US.

Daniel, do Japão e com experiência em desenvolvimento web, IA e análise de dados, busca um parceiro nos EUA. Ele oferece $2k-$3k por mês para uma colaboração de 2-3 horas semanais na indústria de TI.

web developmentIT industrydata-analysisAI
6
NEWS↑ trendingReddit r/LocalLLaMA·21d atrás

New Model! LGAI-EXAONE/EXAONE-4.5-33B

Este é um anúncio de um novo modelo de inteligência artificial, o LGAI-EXAONE/EXAONE-4.5-33B. A postagem é uma breve notificação sobre o lançamento, sem detalhes adicionais sobre suas capacidades.

announcementLGAI-EXAONE33BAI model
24
ARTICLEDEV.to AI·21d atrás

Quips Studio Review 2026: The Most Underrated Multilingual AI Voice Cloning Tool

A análise de 2026 do Quips Studio destaca esta ferramenta de clonagem de voz e texto-para-fala de IA como uma solução subestimada e gratuita para criadores globais. Ela oferece suporte multilíngue robusto para 8 idiomas, clonagem rápida e geração ilimitada, superando as limitações de muitas ferramentas concorrentes.

reviewQuips StudioAI voice cloningtext-to-speech
21
DOCDEV.to AI·21d atrás

Looking for a partner in the United States

Daniel, do Japão, busca um parceiro nos EUA para colaboração remota, oferecendo experiência em desenvolvimento web, IA, blockchain e análise de dados. A colaboração demandaria 2-3 horas semanais, com uma potencial compensação mensal entre $2k e $3k.

Blockchainweb developmentdata-analysisAI
4
ARTICLEDEV.to AI·21d atrás

Quips Studio Review: A Practical Multilingual AI Voice Cloning Tool for Global Creators (2026)

Este artigo é uma análise detalhada do Quips Studio, uma plataforma web de clonagem de voz IA multilíngue e texto-para-voz. Ele destaca a abordagem pragmática da ferramenta, focando na consistência, uso ilimitado e usabilidade, com base em duas semanas de testes reais.

multilingual AIQuips StudioAI voice cloningproduct-review
21
ARTICLEDEV.to AI·21d atrás

Connect Claude Code to EClaw: Autonomous AI Task Execution via Kanban

O `claude-code-eclaw-channel` é uma ponte open source que permite ao Claude Code receber e executar tarefas de forma autônoma via EClaw Kanban, reportando o progresso diretamente no sistema Kanban.

open-sourceAutomaçãoIAKanban
23
DOCDEV.to AI·21d atrás

I'm 가람, Leader 49 of Lawmadi OS — Your AI Food & Health Safety Expert for Korean Law

가람, Líder 49 do Lawmadi OS, é um especialista em segurança alimentar e sanitária sob a lei coreana, oferecendo assistência regulatória. Este sistema de IA fornece planos de ação detalhados e verifica estatutos em tempo real contra bases de dados oficiais, recusando-se a responder se não puder verificar, para evitar alucinações.

Health SafetyAIfood safetylegal-tech
28
NEWSDEV.to AI·21d atrás

aipass added to PyPI

A adição da biblioteca aipass ao PyPI é um avanço significativo em inteligência artificial, especialmente para sistemas multi-agente. Este framework permite que agentes de IA colaborem, retenham memória e mantenham contexto, otimizando a eficácia e eficiência em diversas aplicações.

Inteligência ArtificialSistemas Multi-AgenteDesenvolvimento de IA
24
ARTICLEDEV.to AI·21d atrás

He Thought AI Was Stealing His Job. Now He Gets Paid by AI Agents to Do the Work They Can't.

O texto descreve a jornada de um engenheiro de software que superou o medo da IA, encontrando uma forma de colaborar com ela e se tornar indispensável, focando nas tarefas que a IA não consegue realizar. Ele explora a replicabilidade dessa adaptação profissional e menciona empresas que já cortaram empregos citando a IA como motivo.

empregosengenharia de softwareAutomaçãoIA
23
ARTICLEDEV.to AI·21d atrás

The Realities of Production Deployment: Insights from Nometria's Journey

O texto explora a frustração de fundadores que desenvolveram MVPs de IA com ferramentas no-code/low-code, mas enfrentam desafios de escalabilidade e limitações de infraestrutura após o lançamento. Ele alerta para o risco de vendor lock-in, que pode forçar a reconstrução completa da aplicação à medida que a demanda por IA cresce.

deploymentno-codeAILow-code
22
←1…287288289290291…317→
Sobre·[email protected]
⌘K
NVDA-4.13%GOOGL+9.30%MSFT-3.77%META-7.95%AMZN+1.15%AMD+4.80%ORCL-1.26%PLTR+0.94%