

Хеш md5 по сути конченый, а значит...
А значит, что если создать 17.5 миллиардов чего либо отличного друг от друга, то некоторые хэши уже будут повторяться. Я правильно понимаю? По сути же хэшировать можно что угодно, от текста до видео, а следовательно если хэшировать каждый отличный друг от друга объект в интернете, то хэш уже начнёт повторяться. Да и в целом, есть ли реальные примеры этого, как различные объекты имеют одинаковый md5 хэш
ДополненКонечный
Нет, неправильно. При 17.5 миллиардов вероятность коллизии практически равна 0.
Для 128-битного хэша вероятность коллизий становится значимой при 2⁶⁴ = 18.5 квинтиллионов.
Подробности: https://ru.wikipedia.org/wiki/Парадокс_дней_рождения
Проблема MD5 не в том, что коллизии начинаются на малых наборах данных (нет, не начинаются), а в том, что найдены алгоритмы искусственного создания коллизий.
Ну повторяется и повторяется? Что с того. У этого очень маленькая вероятность и само по себе хэширование не предполагает возврата назад. В практике, с повторением хэша вы никогда не встретитесь. Ну и да, md5 сейчас устарел, лучше пользоваться SHA.
MD5 (Message Digest Algorithm 5) - это алгоритм хеширования, который используется для преобразования произвольных данных в фиксированную строку фиксированной длины. Он широко используется для проверки целостности данных и обеспечения их безопасности.
MD5 принимает входные данные произвольной длины и выдает хеш-код фиксированной длины, состоящий из 32-х шестнадцатеричных цифр. Хеш-код MD5 является уникальным для каждого входного набора данных, поэтому даже небольшое изменение в данных приведет к значительному изменению хеш-кода.
MD5 широко используется в различных областях, включая проверку целостности файлов, хранение паролей и других конфиденциальных данных. Однако, из-за некоторых уязвимостей, MD5 не рекомендуется для криптографических целей, так как существуют более безопасные алгоритмы хеширования, такие как SHA-256
то некоторые хэши уже будут повторяться
Тебе нужно несколько человеческих жизней прожить, чтобы столкнуться хоть где-то с одним и тем же хэшем. Либо быть очень удачливым. Вероятность и того и другого ничтожна.
Иными словами, зачем тебе оно если одинаковые значения ты нигде не увидишь?