Регрессионные модели

Форум » Обсудим » Регрессионные модели » Ответить

Регрессионные модели

Дмитрий: На другой ветке, где обсуждался износ возник вопрос по регрессионные модели. Так это не в тему ветки, Я решил начать новую ветку. NPB пишет: [quote]А почему бы не попробовать? Вот нам пришлось как-то выкручиваться при оценке плавучих кранов, на семи (не помню точно) аналогах учли дедвейт, грузоподъемность крана, время после кап. ремонта (могу соврать, давненько дело было, а проверить сейчас себя не могу). Получили неожиданно хорошие показатели точности модели. Оценочную задачку решили. Не буду утверждать, что это идеал, но м.б., если сравнить с другими доступными методами, - не хуже других. Здесь ведь важно то, что работая с малой выборкой аналогов, мы устанавливаем связи ТОЛЬКО ВНУТРИ ЭТОЙ ВЫБОРКИ, не претендуя на описание всех возможных влияний тех или иных характеристик/параметров на стоимость. А это здорово облегчает задачу в ряде случаев. Правда, перенося всю тяжесть доказательства обоснованности на подбор аналогов. [/quote] Смущает (долго не мог подобрать слово) меня стремление многих использовать регрессию, особенно многомерную, для построения моделей. При этом не проводя исследование по значимости, корреляции и др. (вон последний пример - отчет по дому отдыха с Р2=0,24, да и статьи Оксаны туда же). Даже перичную проверку по 2 или 3 сигмам и вариации не проводят. Только мне кажется что в модели дейдвейт и грузоподъемность оказались коллиниарными (если правильно слово использовал - взаимосвязанными), то есть можно было одну переменную упустить. Фактически формируя малую выборку на интуитивном уровне и проводят проверку. Отбрасывая те точки(аналоги), которые не ложаться в модель. Но потом другие чиатют, и говорят как класно, можно не думать, набрать аналогов (какие попались) сунуть в эксель, он что-то посчитал, в отчет тиснул. И заказчик млеет от удовольствия.

Ответов - 110, стр: 1 2 3 4 5 6 All

Kikinda: Дмитрий Какие будут у вас предложения по исправлению всего этого безобразия?

Дмитрий: Надо шаги написать. Помню когда учился на 1-2 курсе физфака, то нам, незнающим тер.вер. мат.статистку, частные производные, объяснили на пальцах как считать погрешность полученных результатов опытов и моделей (экспериментальных функций). Типа: складай так, потом смотри таблицы, потом вот так. Это потом оказалось, что таблицы, были таблицыми Стьюдента. а складай так, было взятие диффиринцала от функции многих переменных. Вот и нам надо простые ясные инструкции. А если там еще умные слова будут, то вообще.

Kikinda: Дмитрий С чего начинать?

Дмитрий: Я это к тому написал, что не надо так стремиться считать регресию. Вон Арнольд Дмитриевич рисует от руки кривые на милиметровке. Я считаю что это правильно Может лучьше вместо регрессии парные сравнения сделать. И проще. Меньше математики - меньше ошибок Вот сдам этот судостроительный завод. Попробую что-нибудь написать, как я вижу, а потом чтобы кто поумней проверил

Kikinda: Мож Арнольда Дмитриевича научить пользоваться встроенным пакетом анализом Эксель? Арнольд Дмитриевич, какие вы данные анализируете и на основании чего строите график? На милиметровке уже нынче не строят, не модно. Я как сдам судостроительный завод, так пойду по магазинам в качестве награды. Как то тяжело он дается из за того, что работа никому не нужная.

arnold: Дмитрий пишет: Вон Арнольд Дмитриевич рисует от руки кривые на милиметровке. Я считаю что это правильно Может лучьше вместо регрессии парные сравнения сделать. И проще. Меньше математики - меньше ошибок Дмитрий, спасибо! Тем более, что Главный критик высказался... Но это, признаюсь, старомодно ... А как красиво прозвучало бы в отчете об оценке стоимости фекальной баржи ( для РФФИ) : "... согласно широко распространенному в мировой оценочной практике методу Монте-Карло была построена трехмерная регрессная модель ...

arnold: Kikinda пишет: Мож Арнольда Дмитриевича научить пользоваться встроенным пакетом анализом Эксель? Арнольд Дмитриевич, какие вы данные анализируете и на основании чего строите график? На милиметровке уже нынче не строят, не модно Оксана, я уже признался, что "чайник", никто меня не обучал, увы, а программа на моем компе установлена на итальянском языке . График я строю на основании данных, полученных из открытых источников ( прежде всего перехожу на удельную единицу сравнения по каждому аналогу ( определяю стоимость одной тонны дедвейта или л.с. или куб. м и т.п.) , а второй фактор ( по оси абсцисс ) возраст подобранных аналогов одной группы ( например, танкера с двумя бортами или однокорпусные - разные кривые ). Пока не могу придумать, как учесть РЫНОК ( ставки на фрахтовом рынке - прекрасный показатель, их всегда можно найти в открытой печати !) . Увы не могу никак связаться с авторами той самой статьи (?), никак на миллиметровке не построишь трехмерную модель ... А судостроительный завод мне приходилось оценивать, но только с позиции ОЦЕНКИ РИСКА СТРАХОВЩИКА ПРИ СТРОИТЕЛЬСТВЕ ТАНКЕРОВ (Херсонская судоверфь, 1994 год )

AMar: Николай Петрович пишет: на семи (не помню точно) аналогах учли дедвейт, грузоподъемность крана, время после кап. ремонта Семь аналогов? Три независимых переменных? Можно, конечно, подобрать функцию, которая точно пройдет по всем семи точкам. Вопрос в том, насколько можно доверять такой функции. И можно ли ее использовать Если у нас есть три опоры, то на них можно без проблем поставить столешницу. Вот только не будут ли с нее падать тарелки? Мне однажды с/подрядчики сдали работу: семь аналогов, три бинарных признака (например, А, Б и В). Среди аналогов В=1 - только у одного, у оцениваемого объекта - также В=1. Как назло, этот аналог и по другим признакам оказался самым плохим. В результате, стат. пакет все "негативное" отнес на влияние В (коэфф. перед В был самым большим, что явно расходилось с аналитикой по рынку), стоимость объекта получилась меньше реальной РС в 2 раза!!! Вот Вам и регрессия!

Дмитрий: arnold пишет: График я строю на основании данных, полученных из открытых источников ( прежде всего перехожу на удельную единицу сравнения по каждому аналогу ( определяю стоимость одной тонны дедвейта или л.с. или куб. м и т.п.) , а второй фактор ( по оси абсцисс ) возраст подобранных аналогов одной группы ( например, танкера с двумя бортами или однокорпусные - разные кривые ). Так всеж на милиметровки или на кмопьютере строите? Вы еще проведите линию на этом графике - удельная стоимость дейдвейда (л.с и т.д.) как металлолома. И сразу будет видно где объект оценки находится. Можно будет сказать что АННЭИ проведен arnold пишет: согласно широко распространенному в мировой оценочной практике методу Монте-Карло была построена трехмерная регрессная модель Нет это не регрессионная модель. Там (Монте-Карло ) сразу получают ответ. Без нахождения функциональной зависимости

arnold: Дмитрий пишет: Так всеж на милиметровки или на кмопьютере строите? Вы еще проведите линию на этом графике - удельная стоимость дейдвейда (л.с и т.д.) как металлолома На компьютере не очень красиво получается (видимо, не умею ). Строить кривую для аналогов по цене металлолома ? Зачем, это никому не нужно. В мировой практике такая оценка упрощена до предела, надо знать лишь две величины : массу порожнего судна и цену одной тонны судового лома на рынке. Дмитрий пишет: Нет это не регрессионная модель. Там (Монте-Карло ) сразу получают ответ. Без нахождения функциональной зависимости А насчет регрессной модели для оценки фекальной баржи - неудачно пошутил.

Дмитрий: arnold пишет: Строить кривую для аналогов по цене металлолома ? Зачем, это никому не нужно Нет я говорил про другое. Вот картинка. Вы же сами ранее писали о проблемеАННЭИ писали, толи лом толи по основному. А если провести прямую стоиомсть лома то сразу видно где объект оценки (зеленая и красная линия) По Объекту 2 не надо писать рыночную стоимость, сразу видно что стоимость лома больше То есть при возрасте большим чем точка пересечения стоимоти лома (синий линии) и расчетной кривой (черная кривая), можно сразу считать только стомиость лома. А Вы разве не так строите график? Я бы только так и строил P.S. Отдельное спасибо Оксане, получилось с первого раза. Очень красиво. Теперь можно руками махать, а то без жестов плохо объснять свои мысли

Андрей Т: Дмитрий Возраст и физический износ не одно и тоже и у Вас может судно 10 летнее быть пригодно только на лом, а некоторые буксиры, которые я оценивал уже 50 лет работают и документы на них продлены дальше, т.е. еще будут несколько лет, так что с возрастом аккуратнее надо.

Дмитрий: Надписи это условность. Чтобы мысль пояснить. Пусть будет эффективный возраст

Kikinda: Андрей Т Мы не говорим про крайние случаи. Когда делается капитальный ремонт (продлевается срок), то кривая получается похожей на пилу. Но это совсем другое. В данном случае, Дмитрий нарисовал общую тенденцию, что с увеличением возраста увеличивается износ, также как и при увеличении возраста человек старее, у него хуже работает сердце, портятся зубы. А вот вчера я в газете по тематике эзотерического прочитала, что есть люди которые с возрастом молодеют или останавливаются на каком то возрасте. Будем считать, что такое бывает....но очень редко. Так что общая тенденция верна. Дмитрию. Кривая со стоимостью лома очень даже показательна. Всегда можно сделать анализ ННЭИ и наглядно продемонстрировать, что стоимость меньше стоимости в лома быть не может...а то насчитают понимаете ли износ по 99%, а потом говорят, что это на самом деле столько стоит.

Андрей Т: Дмитрий Понял. Интересный вариант, что то типа этого строит ЦНИИМФ зависимость падения РС от срока службы, если я не путаю. Только вопрос в обновлении, цена лома на рынке гуляет и на месте не стоит.

Kikinda: Андрей Т Так ты оцениваешь на дату оценки, а когда одна дата никакого разброда и шатания не будет. А вот сама модель строится так: 1990 = 100 руб, 1992 = 80 руб, 1996 = 60 руб. Т.е. срез с рынка на момент оценки.

Андрей Т: Кикинда Судно не человек, его можно капитально отремонтировать, а человека так не получится. PS Придется организовывать на форуме внеурочные курсы йоги и цигуна. Администрация

Дмитрий: Андрей Т пишет: а человека так не получится Ну если закрытую чакру открыть, и канал связи с космосом усилить, то получиться А вообще картинку я привел, что без регрессий можно быстро все посчитать. И не надо доказывать, имел право применить (имею виду статистику по результатам) и какая значимость коэффицентов.

arnold: Браво, Дмитрий! Так и строю график, есть, конечно, нюансы разные ( корректировка данных аналогов и т.п. ) Только здесь мы с графика получаем не физический износ, а цену тонны дедвейта для оцениваемого судна. Идея верная , вот бы мне так научиться строить график! Оксана, может и "чайника" тоже можно научить? Вот здесь теперь хорошее поле деятельности для поиска зависимостей ( нелинейных функций ?), оценки влияния различных факторов и т.п. Так и поступают западные исследователи ( следом за Оксаной ) - за многие годы, скажем 5 -летний период, можно подвергнуть анализу большой массив данных по продажам судов ( многие тысячи!) разных типов. В принципе специализированные оценочные подразделения крупных брокерских компаний так и поступают, в особенности для экспресс оценки и консультаций. Несколько слов о пользе дискуссий. Видимо, в затратном подходе еще столько неведомых путей... Нашел в старом отчете ошибки и даже нелепости ( век живи, век учись...)

AMar: arnold пишет: Вот здесь теперь хорошее поле деятельности для поиска зависимостей ( нелинейных функций ?), оценки влияния различных факторов и т.п. Так и поступают западные исследователи ( следом за Оксаной ) - за многие годы, скажем 5 -летний период, можно подвергнуть анализу большой массив данных по продажам судов ( многие тысячи!) разных типов. А что, есть данные? Готов предложить свои услуги по обработке. Мои скромные знания и официальный SPSS к Вашим услугам, маэстро...

Kikinda: arnold пишет: вот бы мне так научиться строить график! Оксана, может и "чайника" тоже можно научить? Можно научить, не вопрос. Я могу научить кого угодно, спросите у моих студентов. Вот только закончу с этим конкурсом РФФИ, сразу же научу. Правда у Андрей Марчука знаний будет побольше. Я SPSS еще не пробовала, хотя глядя на Андрея (вернее зная про его уникальный талант со слов А.В. Костина), диск уже купила. Арнольд Дмитриевич, пришлите мне какие нибудь обезличенные данные, которые вы обычно используете (ну например, выдерните из отчета), а я устрою Kikinda's masterclass в специально организованной теме. А потом мы сравним что было на миллиметровке и что посчитал Excel.

Дмитрий: arnold пишет: вот бы мне так научиться строить график! Да это я для наглядности быстренько в графическом редакторе (Paint) просто так нарисовал. Что бы наглядно продемонстрировать мысль по поводу стоимости лома. Про то, что сразу видно когда нужно брать стоимость лома Нельзя же так все буквально воспринимать.

arnold: AMar пишет: А что, есть данные? Готов предложить свои услуги по обработке. Мои скромные знания и официальный SPSS к Вашим услугам, маэстро... Уважаемый Андрей (AMar), спасибо за предложение своих услуг. Очень интересное предложение, только вот беда, сейчас нет времени - готовлю материалы к семинару 01-03.10.076 в Калининграде. В моем понимании это большой объем подготовительных работ. Информации слишком много, у меня дома, в Подмосковье банк данных с 1997 года. В свое время у меня были поползновения пригласить программиста с этой целью, даже вел переговоры с одним московским банком ( тогда ничего не получилось). Видимо, такую работу проводит ЦНИИ морфлота (у них есть программа -Андрей Т в курсе), честно говоря, в моем представлении это большой объем работы. Все данные в куче, никакой систематизации, поиск и сбор данных обычно ведется только по конкретному судну .... Вот если бы найти спонсора или Заказчика ... Для пробы отправлю Вам и Оксане табличку из отчета ( порядка 50 аналогов), но только не сейчас ( позднее)

arnold: Kikinda пишет: Арнольд Дмитриевич, пришлите мне какие нибудь обезличенные данные, которые вы обычно используете (ну например, выдерните из отчета), а я устрою Kikinda's masterclass в специально организованной теме. А потом мы сравним что было на миллиметровке и что посчитал Excel. Оксана, спасибо за предложенный мастер-класс, я обязательно пришлю табличку с данными аналогов ( порядка 50 единиц), на базе которой я строил графики ( Дмитрий нарисовал похожий вариант, но , как говорится, дьявол сидит в деталях... ) Просто сейчас очень занят подготовкой материалов к семинару.

Владимир Б.: arnold пишет: Пока не могу придумать, как учесть РЫНОК ( ставки на фрахтовом рынке - прекрасный показатель, их всегда можно найти в открытой печати ! Попробуйте продисконтировать фрахтовую ставку по модели Гордона

Владимир Б.: Андрей Т пишет: а человека так не получится. Ну - отчего же? Пересадку сердца, к примеру - разве нельзя сопоставить с капитальным ремонтом? Был ОСС 3-6 месяцев. А с пересадкой ОСС по факту составил 15 лет. Чем не КР?

АндрейЩ: Kikinda пишет: В данном случае, Дмитрий нарисовал общую тенденцию, что с увеличением возраста увеличивается износ Иногда общие тенденции (я имею в виду рынок) говорят о другом. На Дальнем Востоке рыболовные суда на 80% старше 20 лет. Как для них построить подобную кривую, если все зависит от судовладельца: иные "старички" готовы по тех состоянию еще рыбачить и рыбачить. По моему, с судами все гораздо сложней. Есть регламент предъявления судна Регистру. Сегодня предъявили механическую установку, завтра корпус и т.д. По результатам предъявлений устраняются замечания. Износ наружной обшивки корпуса в определенном месте подошел к критической отметке - его вырезали и заменили. Главный двигатель требует замены вкладышей, втулок подшипников - заменили. Все это относится к категории среднего ремонта (по мнению судоремонтников, границы между средними и капитальными ремонтами сегодня "размыты" и условны), но позволяет постоянно продлевать срок службы судна. Т.о. данная кривая может соответствовать действительности только, если параметром будет, как верно заметил Дмитрий, эффективный возраст. Но эффективный возраст можно определить по фактическому техсостоянию судна. Техсостояние аналогов нам неизвестно. Выходит, что график - красивая картинка, не более. AMar пишет: А что, есть данные? Готов предложить свои услуги по обработке. Только сегодня написал автору Базы данных "Рыболовные суда" Роману Михайловичу, что как выберу время, так попробую данные базы обрабатать на предмет всяких разных зависимостей... А Вы готовы уже это сделать. Если нет у Вас данной базы, то может Романом Михайловичем поговорить, да представить Вам на обработку данные? Он, кстати, на соседней ветке с Арнольдом Дмитриевичем поздоровался.

Дмитрий: АндрейЩ пишет: техсостояние аналогов нам неизвестно. Это всегда не известно, или известно но со слов продавца или агента. Как то выкручиваются же люди. Владимир Б. пишет: Попробуйте продисконтировать фрахтовую ставку по модели Гордона Только не забыть нормы возврата считать по оставшемуся сроку службы, а не по нормативной, как многие делают. Лучьше поэтому использовать текущую стоимость аннуитета на срок оставшейся службы. АндрейЩ пишет: Выходит, что график - красивая картинка, График для илюстрации двух положений: 1. От руки красивее 2. Отсечение ценой лома АндрейЩ пишет: а так старался. Старался не зря. 2 раза вышло.

Владимир Б.: Дмитрий пишет: Только не забыть нормы возврата считать по оставшемуся сроку службы Однозначно

Игорь г. Львов: АндрейЩ пишет: По моему, с судами все гораздо сложней. А как же тогда токарные и другие металлообрабатывающие станки вывезенные с Германии им уже тоже немало лет, но "пашут". А с самолетами. Никто не задумывался почему падают АНы в Африке. Это самолеты, которые отработали все мыслимые и немыслимые ресурсы, но летают, пока не падают. В Алжире даже есть наша ремонтная база, которая их обслуживает.АндрейЩ пишет: Выходит, что график - красивая картинка, не более. График нормальный. Единственно - надо дать уточнение, что он отражает износ только при неизменности условий эксплуатации, без КР и модернизации.

arnold: Игорь г. Львов пишет: График нормальный. Единственно - надо дать уточнение, что он отражает износ только при неизменности условий эксплуатации, без КР и модернизации. Нет, не так. По аналогам нам неизвестно их реальное состояние (какие и когда были ремонты или модернизация), мы фигурируем лишь доступной инфо по цене продажи (предложения), возрасту, дедвейту ( или валовой вместимости и т.п.), гл. двигателю (типу, мощности) и пр. характеристикам. А что касается оцениваемого объекта - там это все мы учитываеи на полную катушку ( грубо -в зависимости от сроком классификации).

Игорь г. Львов: arnold пишет: Нет, не так. По аналогам нам неизвестно их реальное состояние (какие и когда были ремонты или модернизация), мы фигурируем лишь доступной инфо по цене продажи (предложения), возрасту, дедвейту ( или валовой вместимости и т.п.), гл. двигателю (типу, мощности) и пр. характеристикам. А что касается оцениваемого объекта - там это все мы учитываеи на полную катушку ( грубо -в зависимости от сроком классификации). Априори я, как наверное и большинство оценщиков, исхожу из предпосылки о работоспособном объекте с физ износом в 50% (сосояние удовлетворительное), если в информации не указано иное. Здесь я под объектом оценки подразумеваю объект, который уже достаточно длительное время пребывает в эксплуатации и наверняка подвергался ремонтам.

Kikinda: Игорь г. Львов Мне кажется, что ваши 50% нужно корректировать на нормативный срок службы и на тип производства. Если единичное или серийное производство, т.е. там оборудование простаивает (ему по технологическому процессу положено простаивать), то там надо брать меньше чем 50%. А если это трансформаторы, которые прослужили 80% отведенного им свыше и не ремонтировались, тогда можно писать и все 80%. А по поводу сравнения с аналогами я написала свое мнение в соседней ветке. Специально для Арнольда Дмитриевича. У нас с ним давний диалог по поводу осмотров.

Андрей Т: Kikinda если это трансформаторы, которые прослужили 80% отведенного им свыше и не ремонтировались, тогда можно писать и все 80%. Вот как раз трансформаторы одни из самых "долгоиграющих" видов оборудования. А где узнать сколько им отведено свыше?

Kikinda: Андрей Т Cуществуют нормативные сроки службы для энергетического оборудования. Если эти сроки превышать, то получится катастрофа типа той, которая случилось зимой позапрошлого года в Москве. через определенный период времени после начала положен КР и что хочешь, но сделать обязан.

Андрей Т: Kikinda Это все ясно и относится не только к энергетическому оборудованию. Но реальность такова, что работает подолгу. Тогда оценивая работающий старый трансформатор, по которому истек нормативный срок службы, нужно сразу считать стоимость лома и затраты на утилизацию и не надо парится с оценкой, сразу лом и все.

Игорь г. Львов: Kikinda пишет: Cуществуют нормативные сроки службы для энергетического оборудования. Насчет 80% физ износа для оборудования, которое пребывает в эксплуатации интуитивно не хочу верить. Много это. На самом деле оборудование довольно часто прекращают эксплуатировать по экономическим или другим внешним причинам, а не в связи с его физ. износом. А мне четвертую звезду дали. Теперь я полкан. (Случайно заметил).

Kikinda: Опять та же проблема. 80% это не значит, что трансформатор на 80% не работает. Это значит, что он стоит 20% от цены нового.

Игорь г. Львов: Kikinda пишет: Опять та же проблема. 80% это не значит, что трансформатор на 80% не работает. Это значит, что он стоит 20% от цены нового. Тогда речь идет о накопленном износе или обесценивании, но никак не о физическом износе.

Андрей Т: Kikinda Если ты имеешь ввиду, что 80% это рыночное падение цен, тогда с тобой соглашусь, но если физический, то естесственно нет и мне кажется, что у Игорь г. Львов интуиция на правиьном пути Но тогда в данном случае мое мнение, что нормативный срок службы не имеет такого уж решающего значения.

Дмитрий: Тема плавно ушла к обсуждению, что такое износ в оценке. Физическое устаревание или обесценивание. Конечно наболело это Но позволю вернуться к первоначальной теме. На другой ветки я написал, что если R2=0,24, то применять модель нельзя. мне ответили, что AMar пишет: Если коэффициенты уравнения значимы, и само уравнение значимо, то маленький "R2" говорит лишь о том, что надо учесть что-то еще. Но он не говорит о том, что модель применять нельзя. Поэтому, например, для расчета поправок такую модель вполне можно использовать (надо только грамотно в отчете написать, а то проверяющие знают только R2). Мне кажется что если в модели "надо учесть что-то еще", чтобы объяснить 76% отклонение модельной цены от наблюдаемой, то модель не верна.

AMar: Дмитрий пишет: Мне кажется что если в модели "надо учесть что-то еще", чтобы объяснить 76% отклонение модельной цены от наблюдаемой, то модель не верна. 1. Смотря для чего строится модель. Если, например, для расчета поправки, то применять можно (при условии, что коэффициент при данной переменной значим и сама функция значима - это очень важно). Что это значит: Мы знаем, что цена некой штуковины зависит от параметра А и мы нашли как зависит. Но оказалось, что параметр А описывает только 20% изменения цены. А вот про остальные 80% - мы ничего не знаем. Если есть возможность улучшить модель - я только за. А если нет? (например, по аналогам необходимую информацию собрать не удается) Можно все усреднить, но лучше использовать модель. Т.к. она лучше, чем среднее (повторяюсь, при условии, что модель значима. Если правильно помню, нуль-гипотеза в этом случае звучит так: "модель лучше, чем среднее" или наоборот "среднее лучше, чем модель" - точно не помню, надо учебник глянуть). 2. Приведу один абстрактный пример. В две колонки Excel Вы забили такие функции: В колонку А: =СЛЧИС() В колонку B: =СЛЧИС()+0,5 Пусть это будут цены аналогов. Вам надо ответить на вопрос, отличаются ли аналоги из колонки А от аналогов из колонки В? Ваш ответ: нет, не отличаются, потому что R2 - маленький. Мой ответ: да отличаются, но это отличие описывает только ХХ% вариативности цен.

NPB: Дмитрий пишет: Я это к тому написал, что не надо так стремиться считать регресию. Вон Арнольд Дмитриевич рисует от руки кривые на милиметровке. Я считаю что это правильно Может лучьше вместо регрессии парные сравнения сделать. И проще. Меньше математики - меньше ошибок Сразу вспомнилось "Хорошо начал, да плохо кончил". Из того, что многие не хотят думать, а хотят "быстренько" использовать не простые, в общем, методы совсем не следует, что эти методы не нужно осваивать. Мои скромные усилия "в оценочном русле" как раз и направлены на внедрение в практику оценки и сознание коллег НЕОБХОДИМОСТИ корректного использования этого мощного аппарата. Регрессия далеко не так проста, как кажется с виду, если есть интерес, можно обсудить нюансы. Но, думаю, процесс пошел бы быстрее, если бы участники предварительно хотя бы в минимальной степени освежили в памяти основы рег. анализа. Но вот задачка Арнольда Дмитриевича об оценке влияния различных факторов (при наличии достаточной информации) - это как раз то поле, где конкуренты многомерной регрессии отдыхают. Насчет парных сравнений. Мы уже обсуждали разброс рыночных цен на ИДЕНТИЧНЫЕ с т.зр. покупателя товары. Он весьма не маленький. Вы можете оценить погрешность (точность, дов. интервал - что угодно) процедуры, согласно которой различие в ДВУХ ценах двух НЕ ИДЕНТИЧНЫХ объектов ОТНОСИТСЯ на разницу СТОИМОСТЕЙ этих объектов? Полагаю меньше математики здесь - совсем НЕ "меньше ошибок".

NPB: AMar пишет: Семь аналогов? Три независимых переменных? Можно, конечно, подобрать функцию, которая точно пройдет по всем семи точкам. Вопрос в том, насколько можно доверять такой функции. И можно ли ее использовать Если у нас есть три опоры, то на них можно без проблем поставить столешницу. Вот только не будут ли с нее падать тарелки? Я всегда был убежден, что три опоры устойчивей четырех. А что, действительно невозможно удержать тарелки на столике с тремя ногами? Может быть не количество ног определяет эту угрозу, а нечто другое? Я не утверждаю, что именно семь анаологов, некогда сейчас искать, да и не это главное. В одной из публикаций (доступной, кстати на Аппрайзере), мы показали, что минимально необходимое число аналогов зависит от степени их близости, тесноты выборки, если угодно. В частности, если они очень близки, достаточно и 2k+1 штук, где k - число влияющих факторов. Заметьте, AMar, вывод Ваш также тривиален, как и вывод Дмитрия - кто-то не умеет грамотно пользоваться этим инструментом, поэтому - инструмент негож. Здесь уместно вспомнить, что качество, например, спортивного оружия оценивается не по результатам стрельбы новичка (неумехи), а совсем по-другому.

Дмитрий: AMar пишет: 2. Приведу один абстрактный пример. не-е-е. Пример не в тему. Под рукой нет учебника, чтобы умные слова написать. Строиться модель, потом по моделе вычисляются известные значения. И смотрят разницу - остаточную сумму. Чем больше остаточная сумма, то есть расхождение расчетных данных от наблюдаемых, тем меньше будет R2. Вообще в эконометрике считается что при R2<0.7, модель отвергается. Например, построим модель - Цена =f( возраст) для автомашин. И туда поместим все машины и мерсы и жугили. Да модель имеет месть жить, так как покажет какую-то взаимосвязь между возрастом и ценой, но пользоваться моделью нельзя

NPB: Здесь поддержу Дмитрия вот в чем. Несмотря на то, что R2 - примитивный и плохо интерпретируемый показатель (для нашей цели есть, например, гораздо более понятная ошибка аппроксимации), модель с его значением 0,24 вряд ли может служить опорой для расчета каких либо количественных соотношений, котрым можно доверять. Чтобы утверждать однозначно, нужно увидеть пример (чудеса ведь разные бывают).

Дмитрий: NPB пишет: вывод Дмитрия - кто-то не умеет грамотно пользоваться этим инструментом, поэтому - инструмент негож Нет я не говорил, что "инструмент не гож". Я акцентировал внимание, что нельзя все сгружать в эксель, который рисует кривую, и потом по ней считать. Не анализирую того что получили. А в первую очередь что загрузили. NPB пишет: минимально необходимое число аналогов зависит от степени их близости, тесноты выборки, если угодно Вот-вот. То есть Вы сначала формируется первоначальную выборку из N>>k(где k-количество параметров) аналогов. Потом на основании опыта (или с помошью статистических процедур), выкидываете выбросы получаете выборку из N>=2k+1 аналогов и строите регрессию. При таком подходе наверно можно и меньше аналогов. NPB пишет: направлены на внедрение в практику оценки и сознание коллег НЕОБХОДИМОСТИ корректного использования этого мощного аппарата. Вот и я про это же. Поэтому и ветку создал. Потому что когда считаю регресию, то пишу умные слова, но ловлю себя на мысле, что смысл их утерен. Это как средневековый монах читает молитву на латыне, а что именно не понимает, но зато знает, когда и что надо прочитать. Вот про доверительный интервал все пишут, но все считают его как-то по разному. Кто среднее выборочное +-сигма*1 (2 или 3), кто среднее выборочное (расчетное) +- сигма*t-Стьюдента, кто еще как то. Да и сигму считают по разному: кто на N делит, кто (N-1)

Мисовец: Дмитрий пишет: Да и сигму считают по разному: кто на N делит, кто (N-1) Вот и напишите, как надо, я считаю, что для наших малых выборок надо на (n-1)...

Дмитрий: Я то же думаю что нужно n-1, но читаю отчеты разных умных людей из крупных компаний, и начал сомневаться в своей правоте.

NPB: Василий Григорьевич, у Вас есть пример КОРРЕКТНОГО расчета дов.интервала для среднего, полученного регрессией. Варианты, описанные Дмитрием, некорректны. Я думал "тиснуть" отдельную статью с практическим примером, но как все успеть? Дмитрий пишет: Вот-вот. То есть Вы сначала формируется первоначальную выборку из N>>k(где k-количество параметров) аналогов. Потом на основании опыта (или с помошью статистических процедур), выкидываете выбросы получаете выборку из N>=2k+1 аналогов и строите регрессию. При таком подходе наверно можно и меньше аналогов. Ну, во-первых, это Вы ТАК ДУМАЕТЕ, что я сначала.... и.т.д. Во-вторых, Вы посмотрели статью, о которой я говорю? Если нет, я готов предложить сменить почетный титул "главный критик" на менее почетный - "гл. критикан", ибо не чувствую конструктива в Ваших возражениях/замечаниях, не обижайтесь, пожалуйста.

Дмитрий: NPB пишет: Ну, во-первых, это Вы ТАК ДУМАЕТЕ, что я сначала.... и.т.д Вот так и убивается вера в лучшее и светлое в неокрепших душах. А как же статья где описываются методы отбора? NPB пишет: Вы посмотрели статью, о которой я говорю? Смотрел, там один раз используется выражение "доверительный интервал" и считают через СКО и стьюдента, но так как СКО2=сигма, то я там (выше) ошибся не поставил корень NPB пишет: сменить почетный титул "главный критик" ну тогда лучше на главный вопрошатель. Вот я читаю книжки по статистике, и там регулярно встречаются фразы "легко видеть" и т.д. А вот мне "тяжело" увидеть. Я поэтому и спрашиваю. Просто не всегда ставлю знак вопроса в конце предложения. Вот в Ваше статье про ассиметри и эксцесс написано - не смещенная оценка. Но ведь СКО считают смещенной (то есть n-1) - непонятно

NPB: Ух, как все запущено-то... Дмитрий пишет: А как же статья где описываются методы отбора? Ссылочку, плииз, пока не въезжаю. Про отбор, Вы, Дмитрий, совершенно правы - это вопрос вопросов (в смысле теории). А вот в практическом смысле - не так все страшно, помогает знание рынка. Не ответ, конечно, с т.з. жаждущего простых рецептов, но не обессудьте, так оно и есть. В недвижимости - помогает знакомство с результатами моделирования рынка методами массовой оценки, аналитическими материалами и обмен мнениями с риэлтерами, девелоперами, инвесторами, строителями (операторами рынка) и коллегами.. В МиО - думаю, аналогичные источники - продавцы, разработчики, "эксплуататоры", коллеги. Главное - уметь это "знание" объяснить, обосновать в отчете. Дмитрий пишет: Смотрел, там один раз используется выражение "доверительный интервал" и считают через СКО и стьюдента, но так как СКО2=сигма, то я там (выше) ошибся не поставил корень Вы ошиблись относительно не только этого корня, но и того, который отражает поправку на "сдвиг" характеристик объекта оценки относительно некоторого "центра группирования" таких же характеристик по выборке аналогов. В матричном виде запись для дов. интервала в регрессии дана в статье И.Н. Анисимовой про регрессию в Экселе. Дмитрий пишет: Вот в Ваше статье про ассиметри и эксцесс написано - не смещенная оценка. Но ведь СКО считают смещенной (то есть n-1) - непонятно Какую оценку называют несмещенной? Ту, что не изменяет своего значения с увеличением объема выборки при сохранении ее (выборки) распределения, не правда ли? Если не ошибаюсь, в книжке К. Доугерти "Введение в эконометрику" показано почему несмещенная оценка для СКО получается делением на n-1. А в Экселе сравните справки по функциям СТАНДОТКЛОН и САНДОТКЛОНП. Но это все "проценты" Важно понимать, что и оценка, данная регрессией, тоже может быть как смещенной, так и несмещенной. И на малых выборках простой формулы типа "если этот показатель меньше порогового - смещена, если больше - несмещена" - нет. Т.е. я хочу сказать, что при достаточном (скажем, больше 10) числе аналогов, какя Вам разница, смещена или нет оценка СКО (делить на 15 или 14 - не все ли равно). А вот насколько Вы и Ваши оппоненты могут быть уверены в самой оценке РС (оценке среднего значения, полученного регрессией) - вот это действительно вопрос, заслуживающий внимания.

Игорь г. Львов: Для коректного использования аппарата мат.статистики надо помнить, что формулы для малых выборок отличаются от формул для выборок нормального размера (не менее 20 наблюдений). Именно для малых выборок n-1. Дмитрий. Читайте литературу по малым выборкам.

Андрей Т: Я вот все думаю, ломается столько копий, но если у нас аналогов не больше 10-15 бывает, и то редко, обычно до 7-8, то можно и тоак увидеть (имеется ввиду без особых статкрутостей, или я не прав?

NPB: Андрей Т пишет: вот все думаю, ломается столько копий, но если у нас аналогов не больше 10-15 бывает, и то редко, обычно до 7-8, то можно и тоак увидеть (имеется ввиду без особых статкрутостей, или я не прав? Переведи

Kikinda: Андрей Т Можно. А как разглядеть "итого" когда у тебя на оценке 500 однотипных объектов?

Андрей Т: NPB Перевожу, если у меня выборка из 5-6 аналогов, то можно без особых наворотов, проверок (Фишера, Грабса и т.д). МНе кажется хватит одного R2. А то я на золотом диске видел отчет, помоему скачал себе. Где взято 5 аналогов, объект оценки лежит между двух, но статистики и проверок наворочено на 2 страницы. Кикинда НЕ понял, теперь ты переведи

Дмитрий: Эти навороты нужны чтобы взять среднее, а не считать регрессии или другие маниипуляци проводить (ну там поправки разные)

NPB: Дмитрий прав, без наворотов не обойтись, но совсем не только "чтобы взять среднее". Именно тогда, когда аналогов мало (5-6-7-8-10) нужно быть уверенным самому (и "передать" уверенность оппонентам) в том, что ты получил "верное" значение. В качестве примера: в процессе "критического разбора" рег. модели оценки ст-ти комбайна по 8 аналогам, предложенной одним из наших коллег, оценка РС "сместилась" на 44% ( с примерно 660 тыс. до примерно 950 тыс.) При этом в "исходной" модели R2=0.921, ср. ош. аппроксимации - 15,4%. В окончательной модели - R2=0.955, ср. ош. аппроксимации - 6,1%. Проверялся и ряд других показателей, в т.ч. контролировалось распределение остатков модели. Андрей, Вам по-прежнему "кажется, хватит одного R2"?

Андрей Т: NPB Я стараюсь подбирать аналоги сразу близкие без особых отклонений. Например стараюсь не мешать в одну кучу станки в состоянии, рабочем, практически новые, с консервации. Стараюсь на первоначальном этапе избегать крайних значений или беру с отличающимися параметрами которые можно доказательно скорректировать. Поэтому после корректировок получаются нормальные результаты. Но если валить все в одну кучу, тогда конечно. Всегда когда проверяю отчеты (просфт иногда) в сравнительном обязательно в первую очередь анализирую подобранные аналоги. Сколько раз натыкался на подбор аналогов "все в кучу", особенно по судам, а потом и получают разброс например стоимости 1 тонны дедвейта например от 280 долларов до 650 долларов и еще усредняют люди. Неужели когда подбираешь аналоги нельзя проанализировать их? В МИО не так много случаев, когда больше 10 аналогов находят.

NPB: Все - супер. Но, как всегда, есть маленькие но.... "Правильным" (кстати, как обосновываем "правильность"?) подбором аналогов не гарантируется "правильность" модели, не так ли? Во-первых, мы обсуждаем РЕГРЕССИОННЫЕ модели, поэтому модель среднего (хоть и частный случай регрессионной) - вроде бы не обсуждаем., Во-вторых, анализ рынка и подбор аналогов - это этап, ПРЕДВАРЯЮЩИЙ построение расчетной модели, но НЕ ЗАМЕНЯЮЩИЙ его. И на каждом этапе - свои фишки. Существуют меры "близости" объектов друг к другу, можно строить алгоритмы формального отбора "самых близких" из них. Однако эти "меры" хороши либо когда веса всех влияющих факторов равны, либо когда они (веса) известны. А когда нет - замкнутый круг: строим регрессионные модели чтобы, в том числе, выяснить влияние факторов, а для обоснования отбора аналогов нужно знать веса (т.е. степень влияния) этих же факторов. Поэтому пока отбор аналогов - на "усмотрение и ответственность" оценщика со всеми вытекающими обязательствами по обоснованию этого выбора. Вот и Ваш пример - по сути - все правильно делаете, но сколько нужно писать/убеждать/доказывать, что и по форме - правильно. Про R2, я так понимаю, вопрос исчерпан, слава Богу.

labrate: NPB пишет: ...замкнутый круг: строим регрессионные модели чтобы, в том числе, выяснить влияние факторов, а для обоснования отбора аналогов нужно знать веса (т.е. степень влияния) этих же факторов. Николай Петрович, замкнутый круг (чтобы выяснить влияние факторов) разрешается с помощью квалиметрии. Могу пример сбросить

Андрей Т: NPB Согласен. Но моя основная мысль была: не перегружать отчет лишней "научностью" и что никакая регрессионная модель не будет работать, если на первом этапе неправильно подобраны аналоги. Я не спорю тем более про применение таких моделей более распространенно в недвижке. Там влияющих факторов на стоимость намного больше чем в оборудовании. А так естественно согласен, что когда необходимо нужно применять.

NPB: labrate пишет: Николай Петрович, замкнутый круг (чтобы выяснить влияние факторов) разрешается с помощью квалиметрии. Могу пример сбросить Пример сбросьте обязательно, Александр Валерьевич, буду признателен, но не дразните только меня квалиметрией. Я ее примитивную разновидность именно по поводу этих самых весов факторов в чужих отчетах насмотрелся. У нас в Питере - это в ходу. Это наименее формализуемая (даже на качественном уровне) из всех процедур сравнения показателей.

Дмитрий: Ну в Питере много что в ходу, вот например вот такая регрессия надо щелкнуть, чтобы увеличить Строиться график: Скорректированное значения по аналогам к нормированной сумме всех поправок по аналогу, выбирается где R2 больше, туда подставляется величина нормированной поправки по объекту оценки и результат готов. Сразу видно крупная контора

NPB: Не в бровь, а в глаз! Это заключительный шаг процедуры, где сумма кодов получается либо при равнозначных весах поправок по разным признакам, либо веса назначаются "экспертно" (простейшая форма квалиметрии). Сама же аппроксимирующая прямая/кривая формально может быть названа одномерной (иногда говорят - парной) регрессией, т.к. строится теми же инструментами. Я не против построения таких кривых - я против того, что оценка "точности" ее построения (да и то, не точности, а "достоверности" - через R2) выдается за "точность" полученного результата оценки. Хотя это - две большие разницы. И проблема даже не в том, что "втирают" пользователям отчета, а в том, что сами не ведают, что творят. И размер конторы здесь не причем. Кстати, раз пошел разговор. Сравнивать полученные таким образом линейную и нелинейную регрессию напрямую по максимуму показателя R2 - некорректно. Для нелинейной в Экселе этот показатель рассчитывается для "линеаризованной" модели. Необходимо сравнивать их значения в исходных координатах. Вот в этом примере результат может быть и обратным. Но это никого не интересует, есть стандартные инструменты Экселя, слышали, что чем больше R2, тем лучше, чего же еще-то?

Дмитрий: ну тогда, раз интересно, покрупнее картинка, где и точность показана +-25% от среднего Только не понятно причем тут регресия, просто согласование полученных результатов

NPB: Вот-вот, называть это методом регрессионного анализа, как делают многие - недопустимо. А регрессия, как таковая, имеет место быть - ведь строится зависимость цены от "суммы кодов" для аналогов и по известной сумме кодов объекта по этой "регрессионной" зависимости определяется цена (стоимость) объекта. Т.е. и Вы правы - "просто согласование результатов" корректировок, и они - это "согласование" проводится путем построения кривой зависимости методом МНК, т.е. регрессионной кривой.

NPB: Вдогонку. Оценки точности +-25% от среднего не увидел.

Дмитрий: NPB пишет: Оценки точности +-25% от среднего не увидел. Да это я погорячился +-25% это размах от среднего А погрешность +-11,5% = 2,78(т-Стьюдента)*91,17(СКО)/2,2 (корень из 5 - количество аналогов)/1000 (среднее значение)

Андрей Т: Кстати оценивая станки старые столкнулся с тем, что R2 не работает. Аналоги намного моложе ОО и у линейной функции R2 был больше, а у экспоненциальной меньше, но стоимость получилась по линейной в минус. Просто нужно сделать график и продлить линию до года изготовления станка и сразу видно, что линейная идет резко вниз в тех годах. Так-что с тем что R2 не вегда объективен, согласен и нужно проверять.

Игорь г. Львов: Дмитрий и другие, а чем вам не нравится регрессия. Как таковая она очень хороша. Единственное замечание у меня к вашим примерам-это наличие целого ряда введенных экспертных значений (кодов), которые на практике очень слабо работают. Считаю, что такого варианта, как в приведенном примере, с ледует избегать. Уж очень неправдоподобным может выдаться результат. Видел я такие работы. Но мат. статистика здесь не виновата. Кстати о погрешности. В связи стем, что на практике , как-правило, оценщики не видят аналогов и не могут в любом случае учесть все различия (просто это невозможно) погрешность рассчетов имеет место всегда. Результат 11% не так уж и плох сам по себе. На малоактивных рынках бывает и хуже. Я в отчете пишу, что рассчеты проведены с относительной погрешностью 5% (или другое полученное значение). А вообще тема достоверности отчетов на мой взгляд, настолько важна, что ее пора выводить в отдельную ветку.

Дмитрий: Игорь г. Львов пишет: а чем вам не нравится регрессия. Да мне регрессия нравиться. Не скажу что часто, но я ее использую в расчетах. В том примере, если бы они провели оцифровку качественных показателей (кстати большая проблема) и построили регрессию, то был бы другой разговор

arnold: Игорь г. Львов пишет: А вообще тема достоверности отчетов на мой взгляд, настолько важна, что ее пора выводить в отдельную ветку. Разумное предложение, только надо бы начинать не с "глобального" ( ОТЧЕТ ?), а выделить изначально основные исходные данные и начинать с них.

Андрей Т: Давайте сначало определимся что называть "ДОСТОВЕРНОСТЬЮ" отчета

NPB: Дмитрий пишет: Да это я погорячился +-25% это размах от среднего А погрешность +-11,5% = 2,78(т-Стьюдента)*91,17(СКО)/2,2 (корень из 5 - количество аналогов)/1000 (среднее значение) Я удивляюсь этой способности "обсчитывать" погрешность результатов, полученных неизвестно как взятыми корректировками. Если я вру (и неизвестно насколько) в каждой из них, как я могу говорить о "погрешности" ПРОЦЕДУРЫ ОБРАБОТКИ как о погрешности ВСЕГО РЕЗУЛЬТАТА?. Дмитрий пишет: В том примере, если бы они провели оцифровку качественных показателей (кстати большая проблема) и построили регрессию, то был бы другой разговор Так это и был бы ДРУГОЙ пример. Давайте обсудим, какие есть у оценщика В РАМКАХ МЕТОДА КОРРЕКТИРОВОК варианты обработки "скорректированных" цен аналогов для получения итогового результата: 1. Расчет среднего (веса одинаковы) 2. Расчет средневзвешенного (веса каждой цены разные - здесь возможны варианты расчета этих весов - валовые корректировки, количество их и т.п.) 3. Построение кривой зависимости цены от "коэффициента качества" и расчет цены объекта по однообразно рассчитанному и для него коэф. качества. 4. Отбор наиболее близких аналогов слева и справа и расчет цены объекта как середина интервала между ценами этих аналогов. 5. Еще что-то? По мне, вариант 3 - далеко не худший вариант (а может быть и лучший) из перечисленных. Но НЕЛЬЗЯ погрешности одной этой процедуры выдавать за ПОГРЕШНОСТЬ РЕЗУЛЬТАТА ВСЕХ РАСЧЕТНЫХ ПРОЦЕДУР.

Дмитрий: NPB пишет: По мне, вариант 3 - далеко не худший вариант (а может быть и лучший) из перечисленных. очень часто при подборе аналогов попадается аналог, который почти такой же как объект оценки, но отличается по одному параметру. Сильно отличается. На пример, такое же помещение но с евроремонтом, а объект оценки убитый. Разный размер земельного участка. И по оборудованию так же это встречается (с ходу не придумал). Можно посчитать достаточно точно поправку. Но она получиться большая и в абсолютных величинах и процентах. Соответственно коэффициент качества будет низким. Тогда по методам 2 и 3 ему (аналогу) присвоиться самый низкий вес, хотя он самый близкий. Вот я поэтому перестал пользоваться методом 2. 3 метод мне кажется достаточно исскуственным. 1 и 4 метод практически одинаковые, только в 4 отбрасывают максимум и минимум В свое время, где-то год назад толи ДИГМа толи ТерУпр ФАУФИ по Москве возвращала отчеты если при изменение весов результат сильно отличался, и это правильно. Если после корректировок аналоги не сблизились то, по моему мнению, или не те аналоги или не те корректировки. "не те" - значит неправильные.

Игорь г. Львов: Я почему-то предпочитаю среднеарифметическое. Ну и чтобы сходимость между значениями была. Хотя иногда после работы с выборкой выбираю одно значение-стоимость наименее отличающегося объекта сравнения. NPB пишет: Но НЕЛЬЗЯ погрешности одной этой процедуры выдавать за ПОГРЕШНОСТЬ РЕЗУЛЬТАТА ВСЕХ РАСЧЕТНЫХ ПРОЦЕДУР. . А если я в согласовании беру во внимание один сравнительный подход то это делаю с чистой совестью.

Андрей Т: Дмитрий В свое время, где-то год назад толи ДИГМа толи ТерУпр ФАУФИ по Москве возвращала отчеты если при изменение весов результат сильно отличался, и это правильно. Если после корректировок аналоги не сблизились то, по моему мнению, или не те аналоги или не те корректировки. "не те" - значит неправильные. Полностью согласен. Видел отчет когда после корректировки результаты отличались в разы и ребята присваивали им еще какие-то веса, выравнивали и усредняли. Только что за веса и почему такие - молчок.

Мисовец: Дмитрий пишет: толи ДИГМа толи ТерУпр ФАУФИ по Москве возвращала отчеты если при изменение весов результат сильно отличался, и это правильно. Если после корректировок аналоги не сблизились то, по моему мнению, или не те аналоги или не те корректировки. Вообще-то различие результата при изменении весов это не то же самое, что аналоги не сблизились. Аналоги вполне могут сближаться в результате внесения корректировок, а при изменении весов результат все равно меняется. А также при внесении корректировок результаты могут расходиться, а весов вообще не нужно. Аналоги они такие, какие есть. Вот продается цех в промзоне и тут у нас одна промзона и не каждый месяц в ней продается цех. Собрал три-четыре таких аналога за пол года, какие-то поправки применил и получил то, что получилось. И если поправки не сближают цены, то это может быть вина поправок, а может быть и нет. Потому что два одинаковых цеха проданные один в прошлом, а другой сегодня по теории должны различаться на величину инфляции. Но если цех в прошлом уже и так дороже цеха сейчас (не понятно почему, но бывает), то поправка на срок реализации цены только раздвинет. А кто может сказать, что это неверная поправка? Дисперсия цен присуща самому рынку, это не наше изобретение. Она на самом рынке может быть большая, распределение может быть совершенно ненормальное, почти сумашедшее, ценообразующие характеристики могут скакать, и взять это всё с рынка, обработать и потом считать, что точность определена нашими методами, а не провидением, это не всегда так удается. Если, конечно, не выдумывать аналоги и их свойства....

Игорь г. Львов: Во Львове и области случаи более "свежей" дешевой продажи цехов в промзоне в основном бывают по следующим причинам: - проплата по двух схемах официальная (безнал) + неофициальная (нал); - уход от налогов при переоформлении; -вынужденная продажа по любой причине; -продажа гос. и муницип. собственности (часный случай 1 причины). Хочу заметить, что на рынке пром. недвижимости я заметил такую вещь: хотят много, а получают - сколько дают. Бывают конечно несоответствия. Но основная причина нужны не здания, а земля. Пришла на ум еще одна причина: влияние окружения. Строительство рядом центра оптовой торговли дает взлет всем ценам в районе. А завода по рециклингу....

Дмитрий: Мисовец пишет: А кто может сказать, что это неверная поправка? Да нет поправка то верная. Но это не поправка на инфляцию - а поправка на изменение цен. Если цены не росли а падали (как сейчас в Москве по квартирам), то объект проданный вчера, дороже, чем объект проданный сегодня. И это не удивительно.

arnold: Дмитрий пишет: Только мне кажется что в модели дейдвейт и грузоподъемность оказались коллиниарными (если правильно слово использовал - взаимосвязанными), то есть можно было одну переменную упустить. Дмитрий, дедвейт и грузоподъемность для грузовых судов, танкеров и сухогрузов - это почти одно и то же (в дедвейте сидит примерно 95% грузоподъемности), а для плакранов - разные показатели. Там под грузоподъемностью понимают масимально разрешенный груз на гаке крана, а под дедвейтом - разницу между п/краном в полном грузу (с грузом на палубе) и его водоизмещением порожнем. Дмитрий пишет: Фактически формируя малую выборку на интуитивном уровне и проводят проверку. Отбрасывая те точки(аналоги), которые не ложаться в модель. Но потом другие чиатют, и говорят как класно, можно не думать, набрать аналогов (какие попались) сунуть в эксель, он что-то посчитал, в отчет тиснул. И заказчик млеет от удовольствия. Именно в этом серьезная ошибка многих, уверовавших, что раз нашел аналоги в Инете - все, никаких проблем, подставляй в программу и... нажимай кнопки.

Мисовец: Игорь г. Львов, Дмитрий Я не о том писал. Я напомню, что вот Николай Баринов вывешивал замечательный стат.анализ цен на телефоны Нокиа, который показал, что распределение широкое и даже бимодальное. А это были телефоны Нокиа. Вот если склады имели бы такой же активный и открытый рынок, как телефоны, то неизвестно, что бы мы там обнаружили. Но рынок складов во многих регионах скрытен и малоактивен. А потому мы там не видим реальную статистику, истинные распределения, средние, а видим в лучшем случае единичные сделки, которые могут различаться, как угодно. Вот в прошлом месяце на Зеленом клину в Бийске продавались такие трехкомнатные квартиры, что риэлтеры говорили: есть одна за 3,5, есть несколько за 1,5-1,7, но если подождете немного, то мы подберем и чуть дешевле, в принципе реально до 1,4... НУ а на сегодня у нас есть три квартиры: 3,5; 1,7, 1,5. Это всё трехкомнатные, первый этаж. Сейчас мне опять кто-ибудь может начать объяснять, :) что дорогая могла быть хороша под офис.... Но дело то в том, что я спрашивал только хорошие именно под офис, и мне такие и называли можно сказать, как родному, и район Зеленый клин он не такой, где сильно мноо разных мест, это пятно такое в низинке у реки намывное частично... Я гворю о том, что рынок дает свой разброс, который можно пытаться выявить, но нельзя существенно уменьшить за счет статистики. Часто на реальном рынке с тремя аналогами видишь, что всё понятно, а наберешь 7 аналгов - увидишь, что ничего не ясно. А восьмого аналога просто нет.

Дмитрий: Мисовец пишет: НУ а на сегодня у нас есть три квартиры: 3,5; 1,7, 1,5. В чем-то разница должна быть. Ну хотя бы в том, что первому денег надо больше. Интересно, почем он продаст. Если есть возможность, проследите. Потом скажите. если не забудете. на мой взгляд, как говориться "лучше меньше, да лучше". Зачем набирать кучу аналогов, проводить с ними манипуляции. Когда можно взять пусть два, но близких и по ним посчитать. А в оборудовании, и одного часто достаточно. Мисовец пишет: телефоны Нокиа, который показал, что распределение широкое и даже бимодальное. В москве есть два рынка по бытовой электронике или технике, стройматериалам, носимым вещам, по покупателям: те кто покупает в М-Видео или Евросети, и те кто едет на "Горбушку", Лужники, Черизовский рынок. Поэтому 2 моды меня не удивляют. Но зато какой простор для "творчества" Когда я считаю оборудование "по честному", по вычитаю и откаты из стоимости. Вот я прозваниваю, и часто, там где высокие цены, мне говорят, если будешь покупать, то тебе лично 5-15% (прям так и хочется снабженцем стать). Это к тому что поправки надо нормально делать.

Мисовец: Т.е. Вы изначально исходите из посыла, что рынок он имеет четкую РС, ну и некоторый разбросик случайных цен а всякий выброс, всякое искажение это или методы не те, или аналоги плохо подобрали. Это хорошо, но вот я не мгу разделить такого оптимизма, я считаю, что субъекты рынка мечутся по этому рынку, они не только не знают толком состояния рынка, но и своих интересов толком не осознают и они живут часто некими легендами: "вот это вчера купили, ну ты не представляешь, за 100 рублей"... И некими страхами: "вот сейчас перед выборами напечатают рублей и подскочат цены, а доллар рухнет" и некими мифами "вот Петя крутой, он ТЦ купил, а Миша вот не крут, он в пяти местах торговые площади арендует... Живет мифами, мало что знает, и цена это такое пятое отражение рынка, а реально она отражает состояние психики двух людей, принимающих решение от имени своих организаций, а у людей эмоции...

Дмитрий: Если разброс большой, а аналогов мало я беру меньшую цену - принцип осторожности - приоритет признания убытков, над прибылью (это у меня после аудита осталось). Но людям объясняю на словах или в отчете это прописываю. Как не удивительно, но Заказчики их читают.

NPB: Дмитрий пишет: на мой взгляд, как говориться "лучше меньше, да лучше". Зачем набирать кучу аналогов, проводить с ними манипуляции. Когда можно взять пусть два, но близких и по ним посчитать. А в оборудовании, и одного часто достаточно. А как же ранние пассажи насчет плохишей, котрые понаберут сначала аналогов, а потом выбрасывают, да модели всякие строют? Дмитрий пишет: В москве есть два рынка по бытовой электронике или технике, стройматериалам, носимым вещам, по покупателям: те кто покупает в М-Видео или Евросети, и те кто едет на "Горбушку", Лужники, Черизовский рынок. Поэтому 2 моды меня не удивляют. Но зато какой простор для "творчества" Вновь ловлю Вас на слове. Тот пример, о котором говорит В.Г. - разброс цен одной модели телефона, продаваемого в интернет-магазинах Москвы. Другой пример - с мониторами Самсунг одной модели, в интернет-магазинах, С БЕСПЛАТНОЙ (т.е включенной в цену) ДОСТАВКОЙ НА ДОМ (в пределах МКАД) - т.е. с т.з. покупателя - ИДЕНТИЧНЫЙ товар. Там также разброс достигал, не помню точно, кажется 40%. Что меня в свое время весьма удивило и заставило задуматься. Воля ваша, но различные сегменты рынка здесь - не причем Так вот, интересно, из какой части этого разброса цен Вы берете свои 1-2 аналога и насколько вы уверенны в том, что определили РС как "наиболее вероятную цену"? И кто у нас на "просторах творчества"?

Дмитрий: Начну с конца. NPB пишет: И кто у нас на "просторах творчества" Про простор для творчества, я имел ввиду, что можно взять любую моду в зависимости от необходимости - нужно выше или ниже посчитать. В большинстве случаев, я это писал, я считаю меньшую стоимость. Особенно когда считаю залоги и взносы в УК, потому что там я, лично как оценщик, несу солидарную ответственность в сумме превышения оценочной цены от рыночной. А если расчет, чтобы узнать почем продать, то я объясняю людям, что это по моему мнению минимальная цена, но можно продать и дороже, если постараться NPB пишет: Воля ваша, но различные сегменты рынка здесь - не причем Можно провести сегментацию по другому Есть люди которые ищут целенаправлено где дешевле, а есть которые покупают в первом попавшемся месте. По продавцам - кто-то работает на обороте, а кто-то на большой наценке. Обе модели жизнеспособны И две моды на потребительском рынке встречаются часто, можно даже сказать что существуют априоре. Такси и "бомбилы", Пятерочка и Седьмой континент, и т.д. А качество услуг примерно одинаковое. NPB пишет: А как же ранние пассажи насчет плохишей Я выражал отрицательное отношение к методам, а не к людям, которые их используют. Потому что чаще всего они не ведают что творят. NPB пишет: понаберут сначала аналогов, а потом выбрасывают, да модели всякие строют Наоборот, я говорил, о том что многие строят модели по всем аналогам, которые нашли, не проводя предварительно анализа сформированной выборки. А затем не смотрят на статистику полученных результатов. И что это не есть хорошо. А лучше, по моему мнению, найти близкие по характеристикам аналоги - пусть один или пару и по ним и считать Кроме того, что на мой взгляд немало важно, я в большинстве случаев пишу, что это не правильно, а правильно так и так, не забывая добавить что по "моему мнению" - то есть не претендуя на "истину". Или пишу, что я точно не знаю как правильно, но мне кажется что вот так как сделано, не правильно (т.е. использую сослагательное наклонение в таких случаях). Вот ранее я писал, что вот мол, вот так я рассчитываю доверительный интервал, вот так я видел другие считают, Вы, NPB, написали что оба варианта не верны, но не написали как верно. Отправили читать свою статью. Я задал вопросы по статье, в которой, кстати, было написана надо считать, как я и считаю, Вы, образно говоря - сделали большие глаза - какая-такая статья. На мой взгляд не хорошо как-то получается.

NPB: Наблюдается сближение позиций. Это радует. Но что-то еще осталось. Дмитрий пишет: Можно провести сегментацию по другому Да хот как проводите сегментацию. Она (сегментация) существует, никто не спорит, разговор о другом - по крайней мере на одном из сегментов, который невозможно разбить с т.з. покупателя (и, кстати сказать, оценщика, который моделирует в данном случае покупателя) на более мелкие (пример с монитором) наблюдается ТАКОЙ разброс ЦЕН, который СТАВИТ ПОД СОМНЕНИЕ МЕТОДОЛОГИЮ определения РС по данным о ЦЕНАХ 1-3 аналогов и ввода поправок к ним. Как говорится, на том - стою. Дмитрий пишет: Вот ранее я писал, что вот мол, вот так я рассчитываю доверительный интервал, вот так я видел другие считают, Вы, NPB, написали что оба варианта не верны, но не написали как верно. Отправили читать свою статью. Я задал вопросы по статье, в которой, кстати, было написана надо считать, как я и считаю, Вы, образно говоря - сделали большие глаза - какая-такая статья. На мой взгляд не хорошо как-то получается. 1. Секретов не держу. Вот выставит Оксана, или Вы, скажем, поможете мне прикрепить файл с обработанными данными А.Д. - разжеванный пример как считать дов. интервал в регрессии - доступен. Не разжеванный - давно висит на Аппрайзере в статье И.Анисимовой ПРИМЕНЕНИЕ МЕТОДОВ РЕГРЕССИОННОГО АНАЛИЗА ДЛЯ ОЦЕНКИ РЫНОЧНОЙ СТОИМОСТИ В СРЕДЕ MS EXCEL На все вопросы (тем более легкие) не могу и не буду отвечать - не останется времени на работу и "трудные" вопросы. 2. Я не делал "круглых глаз", я попросил ссылку. Но не получил. Так что - от такого же и слышу :

Игорь г. Львов: Получил рассчет. Жаль, что часть цифр без формул. Придется изучать пути их получения. Что бросилось в глаза: 1.возраст 12-15 лет - неразличим зачем тогда брать аналоги с другим возрастом? может это искажает конечную цифру? 2. самые близкие аналоги с объектом оценки стоят все-таки дешевле. Вопрооос... Хотя для кредита очень даже....

Дмитрий: Игорь г. Львов пишет: 2. самые близкие аналоги с объектом оценки стоят все-таки дешевле. Вопрооос Вот мне то же интересно, особенно, когда большая часть отчетов, да можно сказать что все, идет на экспертизу, как обосновать что посчитанный по трем аналогам (самым близким) результат менее адекватен, чем результат полученный по регрессии, тем более разница более чем в 2 раза. То есть можно обобщить: Где та грань, когда надо считать регрессию, а когда взять пару близких аналогов?

arnold: Дмитрий пишет: То есть можно обобщить: Где та грань, когда надо считать регрессию, а когда взять пару близких аналогов? Готовясь к семинару, взял из своего архива материалы международного промышленного суда Канады ( иск Фискальной Службы к судоходной компании ). Спор о заниженной стоимости двух купленных в Европе судов В качестве эксперта на суде оценщик отчета судна (главнй эксперт Высшего суда Англии). Его слова : "Оценка не наука, а опыт, опыт и еще раз опыт" - примерно, почти дословно, там более витиевато.

Дмитрий: Опыт это конечно хорошо, но вот надо делать выбор 3,6 или 6 млн.дол. 3,6 по 3 близким аналогам и примерно 6 по регрессионной модели по всей выборке Раз сказали что книжка хорошая (ЦНИИМФ "Морской флот: технико-экономические характеристики"). Вот смотрю эту книжку (взял на выходные почитать), табл 2,1,5 (том. 1, стр.58) тип судна SOKOL полный аналог по классу, дейдвейту, кол-ву контейнеров , типу двигателя (6LF58), месту постройки, кол-ву кранов. Там указана цена на 2002 год - 4,1 млн.долл.США Мне кажется что регрессию нужно применять когда нет прямых аналогов.

Игорь г. Львов: Да и мне кажется, что в регрессии в даyном случае результат улетел. Может на меня давлеет специализация предприятия- вынужденные продажи, но результат регрессии явно завышен с моей точки зрения. Не думаю, что по-факту судно было продано по близкой к этому результату цифре. Но все это ни в коей мере не умаляет работы выполненой Николаем Петровичем Бариновым в Eхel. Его расчетный файл очень хорош как базовый и полезен для использования его в качестве шаблона.

Игорь г. Львов: Еще немного о ценообразующих факторах. Для суден (мнение учасников большого форума) на рс в рамках одного функц. назначения имеют влияние: возраст, дедвейт, флаг. Это и есть базовые показатели. Ввод допольнительных факторов и невозможность разграничить влияние на РС функционального назначения привели к смещению РС. Т.е. практически если смотреть на автомобили, то сравнивали кузов универсал и хэтчбек.

Мисовец: NPB пишет: Не разжеванный - давно висит на Аппрайзере в статье И.Анисимовой ПРИМЕНЕНИЕ МЕТОДОВ РЕГРЕССИОННОГО АНАЛИЗА ДЛЯ ОЦЕНКИ РЫНОЧНОЙ СТОИМОСТИ В СРЕДЕ MS EXCEL Я вот у себя на диске нашел статью из "Проблемы недвижимости", 2001г, вып. 2, Грибовский, Баринов, Анисимова, где прочел: Отметим, что вычислительные процедуры, реализующие проверку выборок малого объема на наличие грубых погрешностей и нормальность, достаточно просты. Программу проверок можно получить по электронной почте, направив запрос по адресу: Bosy.of"гав-гав"spb.cityline.ru Вот интересно, это та самая программа, которую недавно выложил Николай Петрович для проверки по критерию Граббса или все-таки другая? Вроде в статье речь выше шла о проверке нормальности разными методами. И если это другая программа, то я вот запрашивал по этому адресу, но пока ничего не пришло. Ну а за файл с обработкой данных по судам отдельное спасибо. Игорь г. Львов пишет: Получил рассчет. Жаль, что часть цифр без формул. Придется изучать пути их получения. Пути их получения, как я теперь выяснил, просты: Меню/Сервис/Анализ данных/Описательная статистика... В файле этот путь приведен.

NPB: С конца: 1. Программка - та самая. В тексте статьи - тот же адрес, что и в печатном виде (копия, все-таки). Сейчас уж и провайдера такого нет, съел его ROL, который существует ли сам - не знаю. 2. Уточнение. Путь получения характеристик регрессии: Меню/Сервис/Анализ данных/ РЕГРЕССИЯ. Описательная статистика дает полезные , но другие данные. 3. "Жаль, часть цифр - без формул". "Возраст 12-15 лет - неразличим". Это - следствие применения макросов. В первом случае - "Регрессия" (см. выше) - быстро, удобно, но необратимо и без следов. Во втором - результат оптимизации модели по фактору возраст с помощью инструмента "Поиск решения" с наложением ограничений на порядок следования цифровых меток. Об оптимизации есть наша статья на аппрайзере, думаю, нужно будет сделать новую, посвященную отдельно ей, с примерами. И если в первом случае все можно заменить ФУНКЦИЯМИ, то во втором - увы. Равно как и транспонировать матрицы произвольной размерности. 4. "зачем тогда брать аналоги с другим возрастом?" 12-15 - неразличим - означает, что лучшие характеристики модели получаются на данной выборке не с линейной, а с НЕЛИНЕЙНОЙ зависимостью от возраста. И в этой нелинейности - кривая идет горизонтально на участке 12-15 лет. Т.е. "обычно" мы бы дали какую-нибудь скидку на это различие, а регрессия говорит - нет, не надо, в ценах аналогов это не проявляется. С другим возрастом аналоги нужно брать именно затем, чтобы установить характер нелинейности, да и об "охвате" характеристик объекта характеристиками аналогов не стоит забывать. 5. "... мне КАЖЕТСЯ, что результат регрессии ... улетает" Я отмечал уже в наших дискуссиях, еще раз акцентирую - регрессия - мощный и доказательный аппарат ОБРАБОТКИ ДАННЫХ в умелых руках, НО переносит ТЯЖЕСТЬ ДОКАЗАТЕЛЬСТВА достоверности результата в область ОТБОРА АНАЛОГОВ. Другими словами, если мы согласны, что это близкие аналоги нашего объекта и они по своему "обобщенному качеству" охватывают объект (т.е. есть и хуже, и лучше), и ценообразование для всех них, включая объект, можно считать одинаковым - то нам придется признать этот результат, чего бы другого нам не КАЗАЛОСЬ. 6. Нужно помнить, что формируя такую модель мы молчаливо (а в отчете - вполне громко и членораздельно) признаем все сравниваемые объекты (аналоги и об. оц.) НЕЗНАЧИТЕЛЬНО РАЗЛИЧАЮЩИМИСЯ по ОСТАЛЬНЫМ ОСНОВНЫМ влияющим факторам. Т.е. важен "тип верфи (страна постройки)" - считаем, что качество постройки на всех верфях данной выборки сопоставимо - НЕЗНАЧИТЕЛЬНО влияет на цену. Или, скажем, важен флаг - то же самое, хоть флаги разные, но влияние ИМЕННО ЭТИХ флагов на цену - очень слабое. Если это не так - два пути. В первом - мы должны ввести дополнительный влияющий признак (фактор). Во втором, когда аналогов нет - можно рассчитать регрессией стоимость для объекта с признаком как у аналогов, а потом попытаться ввести поправку на отличие. Но этот путь - тернист, ибо вновь "попадаем" на проблемы, от которых пытались уйти, обращаясь к регрессии. Но не невозможен. 7. "...когда надо считать регрессию, а когда взять пару близких аналогов?" Я на такой вопрос отвечал раньше так - когда я уверен, что "генеральная совокупность" аналогов обозрима и тесна - можно работать со средним по 2-3 аналогам. Пример: РС двухкомнатной квартиры (не первый и не последний этаж) в строящемся многоэтажном доме можно уверенно определить по данным недавних сделок или оферт по аналогичным квартирам, выходящим на ЭТУ ЖЕ СТЕНУ ЭТОГО ЖЕ ДОМА. Если такая информация есть - нечего больше тужиться-выдумывать. А вот если взяты квартиры из соседнего дома - извольте озаботиться поиском различий в ценах, и только убедившись в их отсутствии, рассматреть возможность включения их в базу для осреднения. В этом смысле регрессия - более универсальный (математически - более общий) аппарат. Когда различий нет (факторы не влияют) - она прекрасно это показывает. Использование 2-3 "очевидных" аналогов без анализа "генеральной совокупности" может приводить к ошибкам, котрые обсуждались на примере цен на телефоны и мониторы. Могут быть взяты 2-3 значения из середины или с любого края имеющегося (весьма немалого) разброса цен и сделаны неверные выводы о величине среднего по ген. совокупности. Удобно, конечно, когда нужно "играть" с результатом, но мы сейчас обсуждаем, я полагаю, другое. 7. "Мне кажется что регрессию нужно применять когда нет прямых аналогов." Хотелось бы узнать, что вкладывается в понятие - прямые аналоги? Еще раз: регрессия позволяет КОЛИЧЕСТВЕННО ОЦЕНИТЬ РАЗЛИЧИЕ в ЦЕНАХ АНАЛОГОВ по РАЗЛИЧИЯМ В ИХ ХАРАКТЕРИСТИКАХ (признаках, факторах). Если под прямыми аналогами понимаются ИДЕНТИЧНЫЕ оцениваемому объекты - солидарен, регрессии здесь делать нечего. О 2-3 аналогах - см. выше.

Мисовец: AMar пишет: Ну, если с и фи можно определить, то сразу заложить в модель следующие переменные: t; sin(ct+фи) Это ясно, но это было бы хорошо, если бы задача была построить кривую цен во времени, я её построил уже, она стала чуть лучше по параметрам R2 и по Фишеру, но не кардинально лучше. Однако задача у меня не построить сезонную динамику, задача как раз найти среднегодовую цену, учитывая, например, что она плавно снижается, если снижается, или растет, если она растет. У меня данные почти за два года, я строю тренд и получаю соответствующий уровень цены на дату оценки, усредненный по сезонам. Если я добавляю синус, то я получаю значение загрузки на сентябрь, а оно мне как раз не нужно, мне нужно среднее по году... NPB пишет: Василий Григорьевич, у Вас есть альтернативы. Можно действительно строить синусоиду, а можно, если данные позволяют, анализировать т.н. скользящее среднее. Вот я вынес этот кусок из отчета, и составил отдельный файл Excel для загрузки сауны, загрузка зависит от сезона, зимой больше, летом меньше, плюс был ремонт в июне-июле 2006г, эти два месяца я выбросил, сохранив номера месяцев, т.к. не понял, как строить регрессию на данных с лакунами. В среднем загрузка около 100 часов в месяц. В файле я исследую две модели: Модель 1: Загрузка = Загрузка0 + at Модель 2: Загрузка = Загрузка0 + at + b*sin(wt+фи) Параметры w и фи подобрал поиском решения для максимального R2, в результате R2=63% и приличные уровни значимости: для уравнения регрессии 8%, для коэффициентов вообще не больше 1%, ну и более узкий график остатков, на котором также показан растянутый по вертикали график синуса. Но собственно, я бы не сказал, что от ввода синусов что-то реально улучшилось с моделью, потому что прогноз загрузки 51 час в месяц на сентябрь странный судя по данным за тот же сентябрь (105). Скользящая средняя тоже, как увидите, ничего хорошего не дала. Ну а вот насчет других факторов... Понимаете, это одна конкретная сауна и у не вот так вот идут дела, какие могут быть вообще другие факторы, трудно сказать. На листе данные приведены реальные данные, как они есть, но как их в таком виде обработать, я не знаю. Ничего умного не вышло и из скользящего среднего. А вот модель 1 она при плохих показателях дает разумный прогноз.... Ну и прилагаю файлик, чтобы желающие могли глянуть и поэкспериментировать с этим временным рядом. Это файл Excel с данными и моделью

Дмитрий: Мисовец пишет: Модель 2: Загрузка = Загрузка0 + at + b*sin(wt+фи) Вчера вечерком, заглянул в один учебник, пытался найти там подтверждение своих слов для Николай Петровича, то там разделе изучение динамики временых рядов советуют использовать или кубический многочлен или ряд Фурье: y=a0+a1*t+a2*t2+a3*t3 y=a0+S(ak*cos(kt)+bk*sin(kt), k - гармоника от 1 до 4 больше пишут не нужно, в основном к=1

Мисовец: Ну, не знаю, Фурье-анализ в виде y=a0+ a1*cos(kt)+a2*sin(kt), для k=1..5 дает R2 не более 25%, ну а известное уже значение k=5,958228579 дает R2=46%, ну а уравнение: y=a0+ a1*t + a2*cos(kt)+a3*sin(kt) дает R2=63% и прогноз 50 часов, который никуда не лезет. Так что Фурье не помогает, ну а полином, мне кажется, и пробовать не стоит... Вот самое простое, видимо, найти среднее и не мучаться.

NPB: Файл посмотрел бы, конечно, но он не открывается - пэйдж кант би дисплейд Так что - если только на мою яндексовскую почту... Я не знаток анализа временных рядов. Но вот в последнем Эксперте ребята анализируют наши макроэкономические показатели и говорят, между прочим, что полином третьей степени хорошо описывает циклы развития нашей экономики (период 31-36 месяцев).

Дмитрий: Так цифры в столбце это выручка за месяц или что? Чтобы заполнить пробелы в 2006 году данных мало. Темп роста за первый 5 месяцев относительно предыдущего периода +25,8%, Можно было бы исходя из этого посчитать прошлый год, но в августе -18% и это все портит. Цепные месячные индексы тоже прыгают Кстати, поиск решения дает разные решения при разных начальных значений У меня получилось 5 пар для R2=63%

Мисовец: Это загрузка сауны, часов в месяц Файл Н.П. на яндекс отправил

Дмитрий: Мисовец пишет: y=a0+ a1*cos(kt)+a2*sin(kt) там суммирование по k y=a0+ Sk=1(a1k*cos(kt)+a2k*sin(kt)) k=1,2,3 ... (целые числа), а1 и а2 меняются при разных k То есть нельзя взять к=4, без учета первых трех гармоник Причем t советуют брать кратным "пи" от 0 до 11/6*пи, а не номер месяца. Хотя конечно, сумма косинуса и синуса сделана чтобы "фи" не расчитывать

Мисовец: Ну, тогда я не знаю, как сделать: пакет анализа на Фурье выдает какие-то числа, что с ними дальше делать справка Экселя не говорит :(

Дмитрий: Пока предыдущее сообщение правил, Вы успели ответ написать. А это к отчету по Озеркам или отдельный расчет?. Если по Озерькам, то лучьше считать через загрузку всего комплекса. Если отдельный отчет то проблемы. Мне как то было нужно считать сауну (в начале года), я проводил полевые испытания, с владельцами разговаривал. В Москве потихоньку бизнес по саунам сворачивается(можно даже сказать помирает) - доходность падает, да и милиция вокруг хороводы водит. Существенная часть выручки идет от сопутствующих услуг - девочки, выпивка и т.д. Про что в отчете не напишешь. Большая часть затрат на тех кто водит хороводы. про это тоже не напишешь. И никакая статистка не сможет учесть облавы. Чистый доход от средней сауны (2 отдельных парилки) примерно 2-3 тыс.у.е. в месяц, если нет звезд на плечах. А если есть то большераза в два или три, смотря сколько звезд

Мисовец: Ну, наша милиция она не такая, она делом немного занимается :) По каким озеркам? Это обычная сауна, загрузка всего комплекса к ней отношения не имеет. Да и не в оценке проблема, оценку я сделал давно и сдал. Просто вот благодаря Николаю Петровичу я научился искать линейные регрессии, разбирать в них что-да как, ну, может ещё не вполне научился, но вроде на правильном пути, и тут встречается нелинейная динамика и загрузки и доходов, и чего хотите, сезонность. Вот что с нею делать? Ведь в реале часто бывает сезонность.... Так что если тут понять, то и в других местах будет понятно, и в реале так обычно и бывает, что есть динамика двух-трех лет по месяцам или кварталам и в ней надо разобраться. Вот я и хочу понять, что может статистика в этом деле....

Дмитрий: Да еще, у меня (в моем отчете) получилось, что средняя загрузка 109 часов в месяц из расчета на год, у Вас так же

Мисовец: Ну, я же выложил реальные данные, средняя, смотря по какому периоду, по всему тренду 104, так что в принципе так же.

полная версия страницы