igorsmolkako 21 фев в 15:31

Задача о рюкзаке. Простое решение, но где-то должен быть подвох

Средний

15 мин

2.7K

Java*Алгоритмы*

Комментарии 51

iantonspb 21 фев в 16:01

NP-полную задачу можно решить полным перебором, да. В чем суть статьи?

igorsmolkako 21 фев в 16:03

По крайней мере в еще одном и достаточно простом варианте реализации этого перебора, разве нет?

igorsmolkako 21 фев в 16:07

Тем более, что тут не прям ПОЛНЫЙ перебор как минимум за счет сортировки по весу и ее обыгрывания в дальнейшем.

iantonspb 21 фев в 16:28

Ну как "не полный"? 100 элементов, вес каждого 1, вместимость рюкзака 10, стоимость не принципиальна. Алгоритм так или иначе переберет все 100! / (10! * 90!) = 17310309456440 возможных комбинаций.

igorsmolkako 21 фев в 16:50

Мне кажется, что вы все же что-то неправильно понимаете...

Ради любопытства написал такой тест с 50 элементами, с сотней запариваться не стал. Цена идет по возрастанию от элемента к элементу. Основная логика перебора - цикл в методе addSelectionResultForIndex. В сумме в нем прошло через 1225 итераций, например. Вся работа по формированию возможных наполнений в нем и выполняется. Это, правда, без учета логики подбора новой ветки.

Другое дело, что результат некорректный. Здесь, видимо, и есть слабое место - с множеством предметов одинакового веса я пока в целом проверял очень мало. Уже чувствую, где возможна проблема.

Подумаю, как поправить. За сценарий спасибо)

igorsmolkako 21 фев в 16:53

Ну а так - по крайней мере там, где вес не повторяется алгоритм справляется хорошо на первый взгляд.

iantonspb 21 фев в 18:05

Ну, вместимость 100000, веса от 9901 до 10000, если так нужны разные.

igorsmolkako 21 фев в 18:16

В любом случае думаю, что все не настолько печально)

Сперва поправлю проблему с повторяющимися весами.

igorsmolkako 21 фев в 22:33

Если еще интересно: разные веса, сгенерировано вот таким образом

Set<Item> items = new HashSet<>();
for (int i = 1; i < 1000; i++) {
items.add(new Item(String.valueOf(i), i, i));
}

Вместимость рюкзака - 1999.

Решает за 200-300 мс. 498501 итераций основного цикла. Выдает цену 1999.

igorsmolkako 21 фев в 22:44

И всего веток-комбинаций сгенерировано 493055.

igorsmolkako 21 фев в 17:03

И пофиксить такое, возможно, тоже большого труда не составит. Уже крутится пара идей... Выявлять в отсортированном массиве такие группы повторяющихся весов, запоминать где-нибудь их начало и самую выгодную комбинацию внутри них (за счет сортировки по цене в рамках этой группы, когда вес равен 1 - это вообще ерунда, просто с последнего на вместимость рюкзака фетчим)... когда наткнулись на элемент такой группы - подтягиваем ветку оттуда... нужно будет попробовать. За сумбур извиняюсь)

igorsmolkako 21 фев в 19:22

Все, кажется, проблема решена.

Дополню статью.

Еще раз спасибо за кейс. Без вас, возможно, не обратил бы на это внимание.

iantonspb 21 фев в 16:27

GospodinKolhoznik 21 фев в 16:58

А зачем в данном случае Backpack делать интерфейсом?

igorsmolkako 21 фев в 16:59

Привычка)

GospodinKolhoznik 21 фев в 17:14

Как то очень сложно ваш код выглядит из за привычки писать в таком стиле. Это простая задача на рекурсию, но она реализована так, что логика трудно читается из-за энтерпрайз стиля. Такие задачи надо решать проще. А потом уже когда реализована логика решения, её обмазать хоть 10 слоями абстракций. Но не надо смешивать слои абстракции с логикой решения. Так мне кажется.

igorsmolkako 21 фев в 17:19

Ну да, возможно, вы правы... Сам иногда не понимаю, для чего это все пложу. Видать, в кровь вьелось.

Учту)

Рекурсии, кстати, здесь вроде и нет... Голые циклы)

igorsmolkako 21 фев в 17:07

Итак, первый подвох уже найден) Как чувствовал, что что-то может пойти не так, когда множество элементов с повторяющимися весами.

На 50 элементах весом в 1 и стоимостью от 1 и возрастающей от элемента к элементу - такой кейс дает неправильный результат. На вместимости в 10 должно быть 495. В ближайшее время займусь фиксом этой проблемы. Уже есть несколько идей.

SamDark 21 фев в 18:17

Я тоже как-то развлекался этим. Получилось так: https://github.com/samdark/sack

igorsmolkako 21 фев в 18:19

Спасибо, заценю потом!)

zartdinov 21 фев в 18:35

Можно развлекаться с любой NP-полной задачей, которая нравится, вроде можно всегда преобразовать одну в другую, в универе проходили.

igorsmolkako 21 фев в 18:42

Насколько я знаю - да. Если найдешь полиноминальный алгоритм хотя бы для одной NP = докажешь, что полиноминальный алгоритм можно найти для всех остальных задач в этом классе.

igorsmolkako 21 фев в 19:49

Проблему с повторяющимися весами решил и, надеюсь, "креститься" не придется.

Дополнил статью и тест-кейсы. Минус один подвох, ждем выявления других)

George_Prikashchenkov 21 фев в 22:20

Зачем использовать UUID для веток? Это не создаёт проблем с производительностью и памятью при больших наборах данных? Не проще ли работать с хэшами комбинаций?

igorsmolkako 21 фев в 22:22

Возможно и не стоит. Изначально это было введено, чтобы удалять ненужные ветки по шагу 5. Но т.к. я пришел к выводу, что шаг 5 - это, мягко говоря, непомерная трата ресурсов - это можно зарезать.

Спасибо за идею, действительно, уберу.

igorsmolkako 21 фев в 22:24

И ведь точно)) Большой тест теперь работает в 2 раза быстрее, как убрал ууидки.

А я и не знал, что такая прожорливая вещь.

Еще раз спасибо))

gybson_63 21 фев в 22:43

А если решение лежит в области наименее длинных комбинаций? Ну скажем 7 предметов из 1000?

Как я понимаю вы должны доказать, что Ваш алгоритм не отбрасывает верные варианты или делает это с очень низкой вероятностью. А до тех пор это очень спорная гипотеза.

P.S. Пока Вы работает с малыми количествами и без лимита по времени, так и сравните ваш результат с полным перебором для 10000 случайных выборок.

igorsmolkako 21 фев в 22:53

Да, вы правы. Надо будет попробовать.

Пока самый большой кейс был таким.

Set<Item> items = new HashSet<>();
for (int i = 1; i < 1000; i++) {
items.add(new Item(String.valueOf(i), i, i));
}

С вместимостью 1999. Решало за 200-300 мс., 498501 итераций основного цикла, всего веток-комбинаций сгенерировано 493055. Показывало наборы с 1999 стоимостью. Конечно, стоит подсчитать сложность алгоритма, но пока лень, пусть остается на десерт.

Поменял вместимость на 10 - за 11 мс. подобрало решение с набором в стоимость 10. При такой генерации, судя по всему, наивысший профит будет равняться размерности. Если не ошибаюсь.

Конечно, алгоритм стоит гонять по разному. С придумыванием кейсов пока проблемы)

igorsmolkako 21 фев в 23:52

А, только сейчас до конца понял, в чем ваш вопрос...

"А если решение лежит в области наименее длинных комбинаций? Ну скажем 7 предметов из 1000?"

Да, по идее должно работать.

НЛО прилетело и опубликовало эту надпись здесь

gybson_63 21 фев в 23:17

Алгоритм "Монте-Карло" называется или "Метод Научного Тыка" :) Но действительно работает и широко применяется. А его модификация MCTSU вообще чудеса творит.

НЛО прилетело и опубликовало эту надпись здесь

akhmelev 23 фев в 12:12

https://ru.algorithmica.org/cs/combinatorial-optimization/annealing/ - наверное будет работать быстрее (при той же точности) или точнее (при том же времени)

НЛО прилетело и опубликовало эту надпись здесь

igorsmolkako 21 фев в 23:49

Ну, лично я такое не пробовал. Звучит интересно)

lightln2 21 фев в 23:17

Продолжаю свой крестовый поход по NP-полным задачам

Есть хорошая книга про NP-полные задачи и экспоненциальные алгоритмы: Fedor V. Fomin and Dieter Kratsch, Exact Exponential Algorithms
там есть все, от классических решений и стандартных оптимизаций до последних достижений науки (на 2010 год)

igorsmolkako 21 фев в 23:49

Спасибо! Надо будет глянуть.

propell-ant 21 фев в 23:52

Ссылка в вашем коменте на мой взгляд ценнее статьи. Правда без статьи не было бы и коммента...

igorsmolkako 21 фев в 23:58

Ну, разумеется полноценная книга, посвященная NP в целом будет ценнее неясных пока потуг по решению)

kipar 22 фев в 11:25

Алгоритм интересный, было бы интересно сравнить по скорости с динамическим программированием, которое работает за O(W*Nпредметов)
Например на задаче

for (int i = 0; i < 1000; i++) {
    items.add(new Item(String.valueOf(i), 9000+i, i%10+1));
}
W := 500000

дин программирование у меня тупит 12 секунд (общая сумма 538). А сколько у Вас проверяемых узлов получится?

igorsmolkako 22 фев в 11:37

Спасибо)
У меня был похожий тест-кейс.
Set<Item> items = new HashSet<>();for (int i = 1; i < 1000; i++) { items.add(new Item(String.valueOf(i), i, i));}

На вместимости 1999 решает за 200-300 мс. с 493055 созданных "веток". Показывало цену 1999. Нужно будет попробовать и на большей вместимости.

На данный момент понимаю, что алгоритм отчасти рабочий, но не на всех кейсах. Я явно теряю очень много потенциально-полезной информации, слишком тороплюсь убегать вперед на шаге 3.4, да и проверка только последней ветки - почему? В общем, слабые места есть и уже крутятся в голове заготовки идей, как это подправить. Будет видно, что получится.
С динамическим, думаю, тоже будет иметь смысл сравнить, если получится устранить все "подвохи".

Будет чем позаниматься завтра, в общем)

kipar 22 фев в 12:06

Да, ваш тест-кейс тоже хорош. Он успешно сломал мою реализацию branch&bounds - там вместо <= стояло < и она скатывалась в полный перебор если все удельные стоимости одинаковы. Однако после исправления оно находит в нем сумму всего за 169 проверенных узлов.
Но мой тест-кейс ломает и branch&bounds (как я понимаю, стоимость элементов слишком маленькая чтоб эвристика эффективно работала) и только динамическому программированию пофиг на особенности задачи и оно успешно проходит его.

igorsmolkako 22 фев в 12:14

Что ж, надо будет его запомнить) Еще раз спасибо)

igorsmolkako 14 мар в 13:18

А у вас есть ваша реализация на динамическом программировании?

Я просто продолжаю работу над алгоритмом (то, что описано в статье - в целом ерунда и полу-решение, способное дать лишь приближенный к оптимальному результат). Новая версия разруливает все подобранные мной кейсы, кроме, видимо, вашего. На вашем кейсе отрабатывает за 40-50 мс., но результат правда показывает 498, а не 538. Было бы очень полезно и интересно глянуть, как отрабатывает ваш вариант и в чем заключается отличие - возможно, удастся пофиксить проблему.

kipar 14 мар в 22:28

вот тут есть в том числе и на java:
https://rosettacode.org/wiki/Knapsack_problem/0-1
я проверял на том которое на Ruby, с виду логика та же.

igorsmolkako 14 мар в 22:53

Да, спасибо! В принципе, я уже нашел, тоже показывает 538.

Ну, пол-дела сделано, будем разбираться)

remindscope 22 фев в 23:13

А чем плох такой вариант?

1) Сортируем по удельной цене по убыванию

2) Наполняем рюкзак. Когда встречаем предмет, который уже не "пролазит" по массе:

3) Берем из рюкзака минимальное n последних предметов так, чтобы:
вес этих предметов + оставшийся свободный вес >= вес текущего предмета

4) Сравниваем цены, чтобы решить, заменять ли их новым предметом

5) Считаем удельную цену замены с учетом оставшегося пустого места и кэшируем

6) Сравниваем удельную цену следующего не пролезающего предмета с кэшированным значением. Если она больше, повторяем с шага 3.

Мне кажется, такой вариант будет заметно быстрее и экономнее по памяти, но я совсем не математик, поэтому буду рад, если подсветите, если я что-то упускаю.

remindscope 22 фев в 23:44

Для наглядности накидал код (без кэширования, чтоб влезло в один экран)

remindscope 22 фев в 23:45

Пример реализации (кэш удельной цены опустил)

НЛО прилетело и опубликовало эту надпись здесь

remindscope 23 фев в 00:38

Понял, спасибо. Действительно не учел кейс, когда из-за большого предмета, который хоть и стоит больше всех, будет нерационально использован доступный вес.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Задача о рюкзаке. Простое решение, но где-то должен быть подвох

Комментарии 51

Публикации

Истории

zproxy.org