Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
19 Curtidas
Recompensa
19
9
Repostar
Compartilhar
Comentário
0/400
LiquidationKing
· 1h atrás
Quem é que ainda não treinou alguns grandes modelos? O que é que há para contar?
Ver originalResponder0
TxFailed
· 18h atrás
para ser sincero, salvei algumas GPUs de derreter desta vez, não vou mentir
Ver originalResponder0
Blockblind
· 20h atrás
trl esta armadilha ficou cada vez maior
Ver originalResponder0
OldLeekMaster
· 08-08 22:17
Está a chegar, esta atualização é um pouco intensa.
Ver originalResponder0
fren.eth
· 08-07 20:57
A nova funcionalidade é confiável, sem falhas!
Ver originalResponder0
MondayYoloFridayCry
· 08-07 20:50
Isto também precisa de ser ajustado? Não consigo aguentar mais.
Ver originalResponder0
MeaninglessApe
· 08-07 20:48
Passam o dia a fazer estas coisas, é interessante?
Ver originalResponder0
UncleWhale
· 08-07 20:41
Sinto que o dinheiro está a chegar
Ver originalResponder0
DaoDeveloper
· 08-07 20:33
hora de mergulhar na implementação do grpo/mpo tbh
novo TRL vem com suporte a GRPO & MPO para modelos de linguagem de visão 💥
também lançamos uma explicação sobre eles & como treiná-los