Регрессионные модели

Форум » Обсудим » Регрессионные модели » Ответить

Регрессионные модели

Дмитрий: На другой ветке, где обсуждался износ возник вопрос по регрессионные модели. Так это не в тему ветки, Я решил начать новую ветку. NPB пишет: [quote]А почему бы не попробовать? Вот нам пришлось как-то выкручиваться при оценке плавучих кранов, на семи (не помню точно) аналогах учли дедвейт, грузоподъемность крана, время после кап. ремонта (могу соврать, давненько дело было, а проверить сейчас себя не могу). Получили неожиданно хорошие показатели точности модели. Оценочную задачку решили. Не буду утверждать, что это идеал, но м.б., если сравнить с другими доступными методами, - не хуже других. Здесь ведь важно то, что работая с малой выборкой аналогов, мы устанавливаем связи ТОЛЬКО ВНУТРИ ЭТОЙ ВЫБОРКИ, не претендуя на описание всех возможных влияний тех или иных характеристик/параметров на стоимость. А это здорово облегчает задачу в ряде случаев. Правда, перенося всю тяжесть доказательства обоснованности на подбор аналогов. [/quote] Смущает (долго не мог подобрать слово) меня стремление многих использовать регрессию, особенно многомерную, для построения моделей. При этом не проводя исследование по значимости, корреляции и др. (вон последний пример - отчет по дому отдыха с Р2=0,24, да и статьи Оксаны туда же). Даже перичную проверку по 2 или 3 сигмам и вариации не проводят. Только мне кажется что в модели дейдвейт и грузоподъемность оказались коллиниарными (если правильно слово использовал - взаимосвязанными), то есть можно было одну переменную упустить. Фактически формируя малую выборку на интуитивном уровне и проводят проверку. Отбрасывая те точки(аналоги), которые не ложаться в модель. Но потом другие чиатют, и говорят как класно, можно не думать, набрать аналогов (какие попались) сунуть в эксель, он что-то посчитал, в отчет тиснул. И заказчик млеет от удовольствия.

Ответов - 110, стр: 1 2 3 4 5 6 All

NPB: Все - супер. Но, как всегда, есть маленькие но.... "Правильным" (кстати, как обосновываем "правильность"?) подбором аналогов не гарантируется "правильность" модели, не так ли? Во-первых, мы обсуждаем РЕГРЕССИОННЫЕ модели, поэтому модель среднего (хоть и частный случай регрессионной) - вроде бы не обсуждаем., Во-вторых, анализ рынка и подбор аналогов - это этап, ПРЕДВАРЯЮЩИЙ построение расчетной модели, но НЕ ЗАМЕНЯЮЩИЙ его. И на каждом этапе - свои фишки. Существуют меры "близости" объектов друг к другу, можно строить алгоритмы формального отбора "самых близких" из них. Однако эти "меры" хороши либо когда веса всех влияющих факторов равны, либо когда они (веса) известны. А когда нет - замкнутый круг: строим регрессионные модели чтобы, в том числе, выяснить влияние факторов, а для обоснования отбора аналогов нужно знать веса (т.е. степень влияния) этих же факторов. Поэтому пока отбор аналогов - на "усмотрение и ответственность" оценщика со всеми вытекающими обязательствами по обоснованию этого выбора. Вот и Ваш пример - по сути - все правильно делаете, но сколько нужно писать/убеждать/доказывать, что и по форме - правильно. Про R2, я так понимаю, вопрос исчерпан, слава Богу.

labrate: NPB пишет: ...замкнутый круг: строим регрессионные модели чтобы, в том числе, выяснить влияние факторов, а для обоснования отбора аналогов нужно знать веса (т.е. степень влияния) этих же факторов. Николай Петрович, замкнутый круг (чтобы выяснить влияние факторов) разрешается с помощью квалиметрии. Могу пример сбросить

Андрей Т: NPB Согласен. Но моя основная мысль была: не перегружать отчет лишней "научностью" и что никакая регрессионная модель не будет работать, если на первом этапе неправильно подобраны аналоги. Я не спорю тем более про применение таких моделей более распространенно в недвижке. Там влияющих факторов на стоимость намного больше чем в оборудовании. А так естественно согласен, что когда необходимо нужно применять.

NPB: labrate пишет: Николай Петрович, замкнутый круг (чтобы выяснить влияние факторов) разрешается с помощью квалиметрии. Могу пример сбросить Пример сбросьте обязательно, Александр Валерьевич, буду признателен, но не дразните только меня квалиметрией. Я ее примитивную разновидность именно по поводу этих самых весов факторов в чужих отчетах насмотрелся. У нас в Питере - это в ходу. Это наименее формализуемая (даже на качественном уровне) из всех процедур сравнения показателей.

Дмитрий: Ну в Питере много что в ходу, вот например вот такая регрессия надо щелкнуть, чтобы увеличить Строиться график: Скорректированное значения по аналогам к нормированной сумме всех поправок по аналогу, выбирается где R2 больше, туда подставляется величина нормированной поправки по объекту оценки и результат готов. Сразу видно крупная контора

NPB: Не в бровь, а в глаз! Это заключительный шаг процедуры, где сумма кодов получается либо при равнозначных весах поправок по разным признакам, либо веса назначаются "экспертно" (простейшая форма квалиметрии). Сама же аппроксимирующая прямая/кривая формально может быть названа одномерной (иногда говорят - парной) регрессией, т.к. строится теми же инструментами. Я не против построения таких кривых - я против того, что оценка "точности" ее построения (да и то, не точности, а "достоверности" - через R2) выдается за "точность" полученного результата оценки. Хотя это - две большие разницы. И проблема даже не в том, что "втирают" пользователям отчета, а в том, что сами не ведают, что творят. И размер конторы здесь не причем. Кстати, раз пошел разговор. Сравнивать полученные таким образом линейную и нелинейную регрессию напрямую по максимуму показателя R2 - некорректно. Для нелинейной в Экселе этот показатель рассчитывается для "линеаризованной" модели. Необходимо сравнивать их значения в исходных координатах. Вот в этом примере результат может быть и обратным. Но это никого не интересует, есть стандартные инструменты Экселя, слышали, что чем больше R2, тем лучше, чего же еще-то?

Дмитрий: ну тогда, раз интересно, покрупнее картинка, где и точность показана +-25% от среднего Только не понятно причем тут регресия, просто согласование полученных результатов

NPB: Вот-вот, называть это методом регрессионного анализа, как делают многие - недопустимо. А регрессия, как таковая, имеет место быть - ведь строится зависимость цены от "суммы кодов" для аналогов и по известной сумме кодов объекта по этой "регрессионной" зависимости определяется цена (стоимость) объекта. Т.е. и Вы правы - "просто согласование результатов" корректировок, и они - это "согласование" проводится путем построения кривой зависимости методом МНК, т.е. регрессионной кривой.

NPB: Вдогонку. Оценки точности +-25% от среднего не увидел.

Дмитрий: NPB пишет: Оценки точности +-25% от среднего не увидел. Да это я погорячился +-25% это размах от среднего А погрешность +-11,5% = 2,78(т-Стьюдента)*91,17(СКО)/2,2 (корень из 5 - количество аналогов)/1000 (среднее значение)

Андрей Т: Кстати оценивая станки старые столкнулся с тем, что R2 не работает. Аналоги намного моложе ОО и у линейной функции R2 был больше, а у экспоненциальной меньше, но стоимость получилась по линейной в минус. Просто нужно сделать график и продлить линию до года изготовления станка и сразу видно, что линейная идет резко вниз в тех годах. Так-что с тем что R2 не вегда объективен, согласен и нужно проверять.

Игорь г. Львов: Дмитрий и другие, а чем вам не нравится регрессия. Как таковая она очень хороша. Единственное замечание у меня к вашим примерам-это наличие целого ряда введенных экспертных значений (кодов), которые на практике очень слабо работают. Считаю, что такого варианта, как в приведенном примере, с ледует избегать. Уж очень неправдоподобным может выдаться результат. Видел я такие работы. Но мат. статистика здесь не виновата. Кстати о погрешности. В связи стем, что на практике , как-правило, оценщики не видят аналогов и не могут в любом случае учесть все различия (просто это невозможно) погрешность рассчетов имеет место всегда. Результат 11% не так уж и плох сам по себе. На малоактивных рынках бывает и хуже. Я в отчете пишу, что рассчеты проведены с относительной погрешностью 5% (или другое полученное значение). А вообще тема достоверности отчетов на мой взгляд, настолько важна, что ее пора выводить в отдельную ветку.

Дмитрий: Игорь г. Львов пишет: а чем вам не нравится регрессия. Да мне регрессия нравиться. Не скажу что часто, но я ее использую в расчетах. В том примере, если бы они провели оцифровку качественных показателей (кстати большая проблема) и построили регрессию, то был бы другой разговор

arnold: Игорь г. Львов пишет: А вообще тема достоверности отчетов на мой взгляд, настолько важна, что ее пора выводить в отдельную ветку. Разумное предложение, только надо бы начинать не с "глобального" ( ОТЧЕТ ?), а выделить изначально основные исходные данные и начинать с них.

Андрей Т: Давайте сначало определимся что называть "ДОСТОВЕРНОСТЬЮ" отчета

NPB: Дмитрий пишет: Да это я погорячился +-25% это размах от среднего А погрешность +-11,5% = 2,78(т-Стьюдента)*91,17(СКО)/2,2 (корень из 5 - количество аналогов)/1000 (среднее значение) Я удивляюсь этой способности "обсчитывать" погрешность результатов, полученных неизвестно как взятыми корректировками. Если я вру (и неизвестно насколько) в каждой из них, как я могу говорить о "погрешности" ПРОЦЕДУРЫ ОБРАБОТКИ как о погрешности ВСЕГО РЕЗУЛЬТАТА?. Дмитрий пишет: В том примере, если бы они провели оцифровку качественных показателей (кстати большая проблема) и построили регрессию, то был бы другой разговор Так это и был бы ДРУГОЙ пример. Давайте обсудим, какие есть у оценщика В РАМКАХ МЕТОДА КОРРЕКТИРОВОК варианты обработки "скорректированных" цен аналогов для получения итогового результата: 1. Расчет среднего (веса одинаковы) 2. Расчет средневзвешенного (веса каждой цены разные - здесь возможны варианты расчета этих весов - валовые корректировки, количество их и т.п.) 3. Построение кривой зависимости цены от "коэффициента качества" и расчет цены объекта по однообразно рассчитанному и для него коэф. качества. 4. Отбор наиболее близких аналогов слева и справа и расчет цены объекта как середина интервала между ценами этих аналогов. 5. Еще что-то? По мне, вариант 3 - далеко не худший вариант (а может быть и лучший) из перечисленных. Но НЕЛЬЗЯ погрешности одной этой процедуры выдавать за ПОГРЕШНОСТЬ РЕЗУЛЬТАТА ВСЕХ РАСЧЕТНЫХ ПРОЦЕДУР.

Дмитрий: NPB пишет: По мне, вариант 3 - далеко не худший вариант (а может быть и лучший) из перечисленных. очень часто при подборе аналогов попадается аналог, который почти такой же как объект оценки, но отличается по одному параметру. Сильно отличается. На пример, такое же помещение но с евроремонтом, а объект оценки убитый. Разный размер земельного участка. И по оборудованию так же это встречается (с ходу не придумал). Можно посчитать достаточно точно поправку. Но она получиться большая и в абсолютных величинах и процентах. Соответственно коэффициент качества будет низким. Тогда по методам 2 и 3 ему (аналогу) присвоиться самый низкий вес, хотя он самый близкий. Вот я поэтому перестал пользоваться методом 2. 3 метод мне кажется достаточно исскуственным. 1 и 4 метод практически одинаковые, только в 4 отбрасывают максимум и минимум В свое время, где-то год назад толи ДИГМа толи ТерУпр ФАУФИ по Москве возвращала отчеты если при изменение весов результат сильно отличался, и это правильно. Если после корректировок аналоги не сблизились то, по моему мнению, или не те аналоги или не те корректировки. "не те" - значит неправильные.

Игорь г. Львов: Я почему-то предпочитаю среднеарифметическое. Ну и чтобы сходимость между значениями была. Хотя иногда после работы с выборкой выбираю одно значение-стоимость наименее отличающегося объекта сравнения. NPB пишет: Но НЕЛЬЗЯ погрешности одной этой процедуры выдавать за ПОГРЕШНОСТЬ РЕЗУЛЬТАТА ВСЕХ РАСЧЕТНЫХ ПРОЦЕДУР. . А если я в согласовании беру во внимание один сравнительный подход то это делаю с чистой совестью.

Андрей Т: Дмитрий В свое время, где-то год назад толи ДИГМа толи ТерУпр ФАУФИ по Москве возвращала отчеты если при изменение весов результат сильно отличался, и это правильно. Если после корректировок аналоги не сблизились то, по моему мнению, или не те аналоги или не те корректировки. "не те" - значит неправильные. Полностью согласен. Видел отчет когда после корректировки результаты отличались в разы и ребята присваивали им еще какие-то веса, выравнивали и усредняли. Только что за веса и почему такие - молчок.

Мисовец: Дмитрий пишет: толи ДИГМа толи ТерУпр ФАУФИ по Москве возвращала отчеты если при изменение весов результат сильно отличался, и это правильно. Если после корректировок аналоги не сблизились то, по моему мнению, или не те аналоги или не те корректировки. Вообще-то различие результата при изменении весов это не то же самое, что аналоги не сблизились. Аналоги вполне могут сближаться в результате внесения корректировок, а при изменении весов результат все равно меняется. А также при внесении корректировок результаты могут расходиться, а весов вообще не нужно. Аналоги они такие, какие есть. Вот продается цех в промзоне и тут у нас одна промзона и не каждый месяц в ней продается цех. Собрал три-четыре таких аналога за пол года, какие-то поправки применил и получил то, что получилось. И если поправки не сближают цены, то это может быть вина поправок, а может быть и нет. Потому что два одинаковых цеха проданные один в прошлом, а другой сегодня по теории должны различаться на величину инфляции. Но если цех в прошлом уже и так дороже цеха сейчас (не понятно почему, но бывает), то поправка на срок реализации цены только раздвинет. А кто может сказать, что это неверная поправка? Дисперсия цен присуща самому рынку, это не наше изобретение. Она на самом рынке может быть большая, распределение может быть совершенно ненормальное, почти сумашедшее, ценообразующие характеристики могут скакать, и взять это всё с рынка, обработать и потом считать, что точность определена нашими методами, а не провидением, это не всегда так удается. Если, конечно, не выдумывать аналоги и их свойства....

полная версия страницы