Во время чистки кеша попадалось много таких страниц

Так как такой параметр не был учтен в настройках композита. Хорошо бы получить инструмент анализа уже созданного кеша композита. Для начала такой анализ мог бы рекомендовать параметры для включения в исключение. В будущем может еще какие-то анализы полезные добавить.
HTTP-Запросы прилетают самые странные, в т.ч. с попытками найти уязвимости и т.п.
По идее, кэш ими засорять смысла нет.
Что хотелось бы от Битрикса в этом случае - инструмент поиска дублей.Поскольку все такие страницы будут иметь одинаковое содержимое, их можно будет как-то выделить и сгруппировать, обозначив проблему. А дальше уже администратор будет думать, как решить эту проблему.
Даже не надо сравнивать файлы - в конце есть хэш, который у дублей полностью совпадает.