Es bastante curioso que con ello se demuestra en tiempo real cómo funciona su compartimentalización en “expertos”. Primero se lanza en que determina qué experto es necesario, ese va sacando la información y en base a ella lanza al experto en censura. Este último es el que mejor han configurado porque no deja pasar ni una.
4 Me gusta
desde ayer existen muchos pantallazos en X con preguntas sobre Taiwan, Tiananmen y otros temas sospechosos. Sí que parece que DeepSeek está muy sesgada de acuerdo a la ideología del PCC, pero tiene el mismo tipo de ajuste fino que emplean los modelos occidentales para no hablar de otras cosas, no discutir sobre el suicidio, o no mojarse en casi ninguna elección.
6 Me gusta
Exacto, y tal como se lee hoy por la Red, es ese Model of Experts (MoE) el que hace que se ejecute con menos recursos, y cueste menos entrenarlo. Parece que ese es el punto clave, y también está por ver qué parte del entrenamiento se pueden haber saltado, o qué problemas pueden que no sean capaces de hacer.
7 Me gusta
3 Me gusta
Me ha parecido bastante coherente esto:
6 Me gusta