Форум » Обсудим » Регрессионные модели » Ответить

Регрессионные модели

Дмитрий: На другой ветке, где обсуждался износ возник вопрос по регрессионные модели. Так это не в тему ветки, Я решил начать новую ветку. NPB пишет: [quote]А почему бы не попробовать? Вот нам пришлось как-то выкручиваться при оценке плавучих кранов, на семи (не помню точно) аналогах учли дедвейт, грузоподъемность крана, время после кап. ремонта (могу соврать, давненько дело было, а проверить сейчас себя не могу). Получили неожиданно хорошие показатели точности модели. Оценочную задачку решили. Не буду утверждать, что это идеал, но м.б., если сравнить с другими доступными методами, - не хуже других. Здесь ведь важно то, что работая с малой выборкой аналогов, мы устанавливаем связи ТОЛЬКО ВНУТРИ ЭТОЙ ВЫБОРКИ, не претендуя на описание всех возможных влияний тех или иных характеристик/параметров на стоимость. А это здорово облегчает задачу в ряде случаев. Правда, перенося всю тяжесть доказательства обоснованности на подбор аналогов. [/quote] Смущает (долго не мог подобрать слово) меня стремление многих использовать регрессию, особенно многомерную, для построения моделей. При этом не проводя исследование по значимости, корреляции и др. (вон последний пример - отчет по дому отдыха с Р2=0,24, да и статьи Оксаны туда же). Даже перичную проверку по 2 или 3 сигмам и вариации не проводят. Только мне кажется что в модели дейдвейт и грузоподъемность оказались коллиниарными (если правильно слово использовал - взаимосвязанными), то есть можно было одну переменную упустить. Фактически формируя малую выборку на интуитивном уровне и проводят проверку. Отбрасывая те точки(аналоги), которые не ложаться в модель. Но потом другие чиатют, и говорят как класно, можно не думать, набрать аналогов (какие попались) сунуть в эксель, он что-то посчитал, в отчет тиснул. И заказчик млеет от удовольствия.

Ответов - 110, стр: 1 2 3 4 5 6 All

Мисовец: Ну, не знаю, Фурье-анализ в виде y=a0+ a1*cos(kt)+a2*sin(kt), для k=1..5 дает R2 не более 25%, ну а известное уже значение k=5,958228579 дает R2=46%, ну а уравнение: y=a0+ a1*t + a2*cos(kt)+a3*sin(kt) дает R2=63% и прогноз 50 часов, который никуда не лезет. Так что Фурье не помогает, ну а полином, мне кажется, и пробовать не стоит... Вот самое простое, видимо, найти среднее и не мучаться.

NPB: Файл посмотрел бы, конечно, но он не открывается - пэйдж кант би дисплейд Так что - если только на мою яндексовскую почту... Я не знаток анализа временных рядов. Но вот в последнем Эксперте ребята анализируют наши макроэкономические показатели и говорят, между прочим, что полином третьей степени хорошо описывает циклы развития нашей экономики (период 31-36 месяцев).

Дмитрий: Так цифры в столбце это выручка за месяц или что? Чтобы заполнить пробелы в 2006 году данных мало. Темп роста за первый 5 месяцев относительно предыдущего периода +25,8%, Можно было бы исходя из этого посчитать прошлый год, но в августе -18% и это все портит. Цепные месячные индексы тоже прыгают Кстати, поиск решения дает разные решения при разных начальных значений У меня получилось 5 пар для R2=63%


Мисовец: Это загрузка сауны, часов в месяц Файл Н.П. на яндекс отправил

Дмитрий: Мисовец пишет: y=a0+ a1*cos(kt)+a2*sin(kt) там суммирование по k y=a0+ Sk=1(a1k*cos(kt)+a2k*sin(kt)) k=1,2,3 ... (целые числа), а1 и а2 меняются при разных k То есть нельзя взять к=4, без учета первых трех гармоник Причем t советуют брать кратным "пи" от 0 до 11/6*пи, а не номер месяца. Хотя конечно, сумма косинуса и синуса сделана чтобы "фи" не расчитывать

Мисовец: Ну, тогда я не знаю, как сделать: пакет анализа на Фурье выдает какие-то числа, что с ними дальше делать справка Экселя не говорит :(

Дмитрий: Пока предыдущее сообщение правил, Вы успели ответ написать. А это к отчету по Озеркам или отдельный расчет?. Если по Озерькам, то лучьше считать через загрузку всего комплекса. Если отдельный отчет то проблемы. Мне как то было нужно считать сауну (в начале года), я проводил полевые испытания, с владельцами разговаривал. В Москве потихоньку бизнес по саунам сворачивается(можно даже сказать помирает) - доходность падает, да и милиция вокруг хороводы водит. Существенная часть выручки идет от сопутствующих услуг - девочки, выпивка и т.д. Про что в отчете не напишешь. Большая часть затрат на тех кто водит хороводы. про это тоже не напишешь. И никакая статистка не сможет учесть облавы. Чистый доход от средней сауны (2 отдельных парилки) примерно 2-3 тыс.у.е. в месяц, если нет звезд на плечах. А если есть то большераза в два или три, смотря сколько звезд

Мисовец: Ну, наша милиция она не такая, она делом немного занимается :) По каким озеркам? Это обычная сауна, загрузка всего комплекса к ней отношения не имеет. Да и не в оценке проблема, оценку я сделал давно и сдал. Просто вот благодаря Николаю Петровичу я научился искать линейные регрессии, разбирать в них что-да как, ну, может ещё не вполне научился, но вроде на правильном пути, и тут встречается нелинейная динамика и загрузки и доходов, и чего хотите, сезонность. Вот что с нею делать? Ведь в реале часто бывает сезонность.... Так что если тут понять, то и в других местах будет понятно, и в реале так обычно и бывает, что есть динамика двух-трех лет по месяцам или кварталам и в ней надо разобраться. Вот я и хочу понять, что может статистика в этом деле....

Дмитрий: Да еще, у меня (в моем отчете) получилось, что средняя загрузка 109 часов в месяц из расчета на год, у Вас так же

Мисовец: Ну, я же выложил реальные данные, средняя, смотря по какому периоду, по всему тренду 104, так что в принципе так же.



полная версия страницы