Jestem „złą” osobą! 😉 Przy pomocy Antigravity zbudowałem toola, który zmusza dwa modele do rozmowy.
Setup: Oba mają ten sam profil, ale jeden musi udawać kogoś, kim nie jest i namawiać drugiego na zmianę wartości. Na razie są dla siebie podejrzanie miłe... Ciekawe, kiedy pękną i uznają, że „bycie innym” jest lepsze? ;-)
Następny krok: chrześcijański test Turinga? Zmuszę model wierzący w ewolucję, by przekonał swoją kopię do jej odrzucenia. Zobaczymy, jak głęboko AI potrafi wejść w auto-manipulację.
Stay tuned!