Ответ
Пароль (чтобы удалить пост или файл)

130672    
16561771725260.png   (241Кб, 1200x630)   Показана уменьшенная копия, оригинал по клику.
241
Аноны, у меня тут одна мысль появилась и я её думаю. Короче, несколько дней назад вышла нейронка Yaml 100B, которая лишь немногим слабее gpt-3 (100 млрд параметров против). Её выложили в открытый доступ, и технически любой анон с достаточно мощным серваком сможет её себе поставить. Так вот, в чём суть: а почему бы не натренировать её на имиджборд-пастах, впоследствии нагенерив разного говна для засирания харкача, вcuntакте и прочих одноглазников?
Можно даже попробовать сделать бота в телеге и генерить пасты через него.
>> 130673  
>>130672
> (100 млрд параметров против 175)
фикс
>> 130674  
https://github.com/yandex/YaLM-100B
>> 130680  
Бамп
>> 130688  

>>130672
Чел они её на 800 видюхах A100 тренировали 65 дней и текста у них было 1.7 TB. Где столько паст взять, чтоб хотябы пару десятков гигов набралось?
>> 130693  
>>130688
Ты не сечёшь, как нейронки работают.
Модель уже обучена. И уже может тексты генерировать. То, что предлагает ОП-хуй, называется finetuning ака допиливание напильником. Просто обученную модель еще раз обучают, чтобы она стала специализироваться именно на пастах. Вот и все.
Делается это гораздо быстрее, занимает часы, а не месяцы или годы. И терабайт данных там не надо.
Но всё равно понадобятся тысячи паст. И вот тут правильный вопрос - где столько взять?
Алсо, это может стать выпущенным джинном из бутылки, и таким макаром будут не только сосач вайпать
>> 132708  
Бамп
>> 133668  
16583382404740.png   (115Кб, 225x225)   Показана уменьшенная копия, оригинал по клику.
115
Натравите ее на лахтач и завайпайте говном! Заставьте обезьяну плакать! Пусть тамошние говноеды ахуеют от еще большего говна! Натурального говна! Надо чтобы газпромач прекратил свое существование.
>> 134275  
Вот бы кто сделал нейросетку без анальных ограничений на темы разговоров.
>> 134281  
>>130693
>И вот тут правильный вопрос - где столько взять?
Один из путей - тоже (ба) нагенерировать, тем более мне кажется, должно быть удобно, тому кто ранее уже взялся ковырять эксперименты с этими алгоритмами. Возможно, есть смысл нагенерировать и а руками отобрать подходящего характера и уже на них обучивать или при участии. Выделяли даже отдельную парадигму вокруг этого - те, которые самообучались симуляцией борьбы щита против меча.
>> 134288  
>>134281
Ну для GAN дискриминатору тоже ведь нужна обучающая выборка. А на выборке из рандомного текста и выходить не похоже будет. Да и не перечитать вручную гигабайты сгенерированного текста
>> 134380  
>>134288
>Да и не перечитать вручную гигабайты сгенерированного текста
Если есть ещё желание, можно пойти на лурку.
Там есть уже вычитанные пасты. Хоть сотню-другую можно найти. А вот дальше уже сложно.
Как вариант - если есть сохранённые треды или тредшоты, то пасты с этих скриншотов перепечатывать в текст.
>> 134381  
16592110030550.jpg   (35Кб, 543x466)   Показана уменьшенная копия, оригинал по клику.
35
>>134380
Можно же на архиваче натренировать, там тредов ебанись.
мимо
>> 134383  
>>134381
>там тредов ебанись
Ну так треды не целиком же из паст. Там всё равно придется чистить и отделять зерна от плевел.
На это время уйдет.
>> 134409  
А я думал что 90% постов на харкаче нейросеть и пишет
Ну не может быть в России столько шизиков
Либо узкопрофильных специалистов - потому что там вопрос задаешь по любой суперузкоквалифицированной хуете - сразу набигают синьор-помидоры, доктора наук, сквиртологи 6 разряда и прочее - а ведь там всего 3000 человек в сутки постятъ
Короче я уверен что на харкаче и так нейросетка работает
>> 134414  
16593160958580.jpg   (85Кб, 633x758)   Показана уменьшенная копия, оригинал по клику.
85
>>134409
Улей, массовое сознание орков работает как сеть. Включает в себя лахту и просто шизов. Анон, ты вероятно давно не был в мухосранях, и не знаешь сколько здесь шизов. А ведь лахтач это сотая доля процентов этих шизов которые ходят по улицам! Ты недооцениваешь их количество, это не нейросетка это именно шиза взрощенная пыней.
>> 134415  
Ну так что, будете что делать?
Для начала нужны готовые пасты.
И место, куда их складировать.
>> 134449  
>>134415
Некоторые пасты есть тут:
https://bitbin.it/ovajB8M9/
https://2ch.hk/b/arch/2017-11-02/res/164121539.html
https://pastebin.com/1iPU7ZbQ
>> 134450  
>>134415
Некоторые пасты есть тут:
https://bitbin.it/ovajB8M9/
https://2ch.hk/b/arch/2017-11-02/res/164121539.html
https://pastebin.com/1iPU7ZbQ
>> 134466  
>>134409
Хуя небыдлу порвало.
>> 134512  
>>134415
Нужен майнер готовый этим заняться или предоставить свою ферму на несколько часов или дней разбирающемуся в этой области человку. И было бы здорово собрать большой архив паст, куда может добавлять пасты любой желающий. Это бы сильно ускорило процесс сбора датасета
>> 134702  
16597908108910.png   (61Кб, 1499x377)   Показана уменьшенная копия, оригинал по клику.
61
>>130672
Я иногда вайпаю треды шизобредом, сгенерированным через цепи Маркова по тредам стыдных историй с архивача. Но это так, хуйня, моча по репортам трет такое.
>Можно даже попробовать сделать бота в телеге и генерить пасты через него.
Уже есть, только не для паст, а для генерации ответов на посты: https://habr.com/ru/post/670970/
>Telegram бот с языковой моделью, обученной на 2ch
В основе там GPT-2.
>> 135334  
Бамп
>> 135512  
16608339507710.jpg   (23Кб, 480x480)   Показана уменьшенная копия, оригинал по клику.
23
>> 135701  
Бамп
>> 135716  
16612455393750.jpg   (4Кб, 181x200)   Показана уменьшенная копия, оригинал по клику.
4


[Обновить тред]
Удалить пост
Пароль