В Индии налоговые дела делятся на прямые и косвенные. Прямой налог включает в себя подоходный налог, налог на имущество, налог на проценты, налог на дарение и т. Д. Косвенный налог включает GST (действует с 2017 года), НДС (все еще применяется к спиртным напиткам, золоту, драгоценностям и т. Д.), Таможенный налог и т. Д. У меня была возможность проанализировать 223k direct tax cases. Самый старый был утилизирован в January, 1950, а самый последний - в August, 2018. В серии постов я хотел бы сделать выводы из этого огромного корпуса. В этом материале учитывается количество дел по каждому суду:

  • Верховный суд (ВС): 3145 (1.4%)
  • Высокие суды (HC): 64847 (29%)
  • Апелляционные суды по подоходному налогу (ITAT): 154963 (69.6%)

Анатомия

Документ судебного дела является ярким примером того, как следует структурировать любой фрагмент текста. Он (предполагается, что читать) убедителен и, что немаловажно, следует по маршруту, который плавно ведет читателя от одного пункта к другому. Понимание элементов, из которых состоит судебное решение, и их характеристик полезно любому читателю, не говоря уже о юристах и ​​практиках. Кроме того, знание примерного местоположения элемента еще до того, как узнать регистр, ускоряет процесс чтения.

Свобода творчества, ненужное многословие и случаи неоправданного перефразирования в сторону, судебное решение, похоже, следовало этому универсальному недосказанному формату, как его понимает парень, не имеющий отношения к юридической сфере:

1.Открытие - краткое описание дела, сведения о том, где оно было изначально подано, и другая необходимая информация.

Это перекрестные апелляции, поданные за год проведения оценки (Assessment Year) 2007-08, направленные против постановления Ld.CIT (A) -XX, Нью-Дели от 6.3.2013.

2 (а). Проблемы- Речь идет о достопримечательностях и краеугольных камнях дела. Проблема - это спор по поводу закона или факта. Краеугольный камень. Вопрос поставлен, суд должен ответить.

Первый вопрос, поднятый ассесси, направлен против действий Ld. CIT (A) в подтверждение добавления 10 747 рупий, которое было внесено АО в качестве счета для пожертвований и подписки.

2 (б). Основания- Основания являются вопросами по мнению сторон. Основания - это проблемы. Это «почему» в случае.

В ИТА № 921 / JP / 2011 за А.Ю. 2004–05, Налоговое управление подало апелляцию по следующим основаниям: 1. То, что ld. CIT (A) допустил ошибку в законодательстве, а также в фактах и ​​обстоятельствах дела при удалении отказа в удовлетворении иска об освобождении от уплаты налогов. 10 (23c) (iiiad) Закона о информационных технологиях 1961 г.

2 (в). Молитвы. Молитвы обращаются в суд.

Заявитель просит разрешения на добавление, изменение, изменение и / или изменение оснований для апелляции во время слушания или до него.

В совокупности основания, проблемы и молитвы можно назвать обращением в суд.

3. Факты. Факты - это то, что произошло по делу. Аргументы и доводы дела основываются на фактах. Хотя обе стороны обычно согласны относительно фактов, в случае возникновения спора возникает вопрос о факте, который суд должен разрешить. Факты включают бизнес / отрасль объекта оценки, проведенные транзакции, сумму и / или оспариваемые транзакции и т. Д.

Краткие факты из этого выпуска заключаются в том, что оцениваемое лицо - это компания, занимающаяся предоставлением маркетинговых услуг компаниям своей группы.

4. Аргументы - возражения или возражения, выдвинутые адвокатом в защиту своей стороны. Эти аргументы подкрепляются утверждениями, которые называются аргументами дела. Адвокат ссылается на закон и прецеденты в обоснование своих требований. Судья или член комиссии также окажет необходимую поддержку при аргументировании аргументации.

На запрос в этой связи assessee сообщила, что эти расходы были фактически понесены в текущем году.

Он был представлен ld. AR of assessee, что оспариваемое постановление, вынесенное CIT (A), является ex-parte qua assessee.

5. Holdings- Вердикт, включая директивы, которые должны быть приняты сторонами. «Части директивы» обозначают действия, которые должны быть предприняты сторонами.

В связи с этим на данном этапе не требуется вынесения решения по существу дела.

6. Результат- сжатая форма заключения в качестве вердикта, чтобы подвести итог делу.

Ссылка утилизируется соответственно без упорядочения затрат.

В результате обе апелляции оцениваемого за оценочные годы 2008–09 и 2009–10 годов разрешены частично, а апелляция департамента за оценочный год 2009–10 отклоняется.

В идеале, если речь идет о более чем одной проблеме закона, пункты 2–5 следует повторять до тех пор, пока не будут решены все вопросы.

Insights

Среднее суждение составляет 6.87 pages по длине. В среднем суждение 2015 words, присутствующее в 69.27 sentences, слилось в 22.89 paragraphs.

Модели классификации текста использовались для прогнозирования этих элементов во всех суждениях. В совокупном корпусе из более чем 0,1 миллиона предсказанных предложений наблюдались следующие тенденции.

Средняя длина символов этих элементов следующая:

  • Представленные: 307.09 символов
  • Аргумент 276.12 символов
  • Удержание: 202.97 символов
  • Результат: 95.15 символов

Представления и аргументы значительно длиннее, чем предложения о приостановлении и исходе. Это потому, что эти два элемента - доводы и аргументы - нуждаются в разъяснении. Предложения с аргументами - это предложения, содержащие четко сформулированные утверждения, как указано в приведенном выше примере. Предсказание каждого аргументационного предложения в лучшем случае - попытка, в худшем - невозможно.

В случаях, когда было предсказано хотя бы одно представление, приговор содержал в среднем 3.74 submissions, 7.44 arguments, 1.07 holdings и 1.91 outcome предложений.

Заметки о машинном обучении

Принимая во внимание статистику, суждение будет состоять из 70 sentences, из которых только ~14 sentences попадают в любую из категорий. Это примерно 20% дело. Это классический пример несбалансированного обучения, с которым можно справиться одним или несколькими из следующих способов: недостаточная выборка, избыточная выборка, создание псевдо-примеров классов с использованием такого метода, как SMOTE, или корректировка параметров модели для наказания. с учетом этого дисбаланса. В нашем случае передискретизация класса меньшинства является лучшим подходом, поскольку большинство этих элементов очень похожи друг на друга по структуре. Недостаточная выборка класса меньшинства приведет к потерям информации.

Чтобы проверить приведенное выше утверждение, я произвольно произвел выборку проблем случая в обучающих данных и получил следующие результаты:

1. Следует ли сообщать о решении в дайджесте?
Имеется ли в виду, исходя из фактов и обстоятельств дела, а также с учетом запрета KSBC на оказание услуг сторонним организациям, был Трибунал правом по закону и факту, разрешив расходование RS.
2. Были ли у компетентных низших властей материальные и были правы в законе, постановив, что законодательные требования, содержащиеся в ст. 269D (2) (b) Закона соблюдается?
3. Вопрос в том, будет ли этот процент квалифицироваться как прибыль, полученная от услуг, предоставляемых иностранным туристам.
4. Был ли для целей расходов изъят какой-либо капитал или, другими словами, было ли целью понесения расходов использовать то, что было принято в качестве капитала бизнеса.

(Выделенные слова и фразы являются классическими примерами гипотетических ситуаций, используемых для выражения сомнений или вопросов. Все эти элементы можно оценить индивидуально по их частям речи и другим языковым характеристикам, но это будет позже.)

Часто один элемент может принадлежать к двум классам (не исключающим друг друга), и multi-label classification будет подходящим. Однако легче начать с одного из элементов вышеперечисленных классов по сравнению со всем остальным.

Поскольку большинство элементов класса похожи по структуре, подход bag of words или TF-IDF отлично подходит для моделирования. Word vectors, похоже, плохо справлялся с не очень большими тренировочными наборами, тогда как первый показал себя хорошо.

Расположение, как видно ниже, также является важной особенностью модели.

Распределение этих элементов в футляре

Примечания:

По оси x расположены различные элементы корпуса. Ось Y перевернута для облегчения понимания диаграммы. По оси Y у нас есть местоположение в кейсе, то есть степень, в которой нужно было бы пройти по кейсу, чтобы достичь определенной строки в тексте (0,2 = 20% в кейсе), начиная с первой строки.

Например, ясно видно, что материалы дела (проблемы и основания) укладываются в первые 40% текста дела. Распределение сохраняется и в конечном итоге сходится.

Анализ и выводы:

  1. Доводы, основания, результат - эти элементы явно расположены в определенных точках дела, тогда как аргументы и доводы разбросаны почти равномерно по делу.
  2. За активами сразу же следуют заявления о результатах.
  3. Представления и аргументы, с другой стороны, более затянуты в HC и SC. На приведенных выше диаграммах они отображаются в виде комков. В ходе анализа была отмечена последовательность и ясность в стиле письма судей HC и SC. Они начинают с четкого описания проблемы, а затем подробно обсуждают ее, прежде чем перейти к другой проблеме. С другой стороны, в суждениях ITAT царит хаос, и такой шаблон отсутствует.
  4. Заявления о холдинге и результатах показывают почти одинаковую тенденцию в разных судах.
  5. Факты (не показаны выше) разбросаны по всему делу.
  6. Среднее расположение этих элементов следующее:
  • Отправленных материалов: 0.29
  • Аргументы: 0.46
  • Начало причин: 0.53
  • Фонды: 0.76
  • Результат: 0.82

Этот порядок подтверждает нашу предыдущую гипотезу об идеальном порядке суждения.

Глядя на несколько лет, материализуется следующий график скрипичного сюжета.

Существует заметная тенденция, которая показывает, что суждения перешли от достаточно структурированной с точки зрения элементов к более свободной с точки зрения структурирования с течением времени. На приведенном выше графике выпуклость скрипки представляет плотность элементов в определенном месте в суждениях. Мы можем видеть, что прогрессия идет от сильно очерченной (более выпуклой) к более размытой концентрации (менее выпуклой), показывая, что теперь элементы более разбросаны с точки зрения позиционирования в суждениях.

Хотя многие говорят, что написание суждений - это искусство, чаще всего им становится и упражнение по чтению суждений. Конечно, помогает, если эта форма искусства, по крайней мере, последовательна по своей сути.

Конец примечания:

  1. Промежуточные постановления, протоколы судебных заседаний и другие неокончательные документы исключаются из этого анализа, поскольку они содержат тривиальную информацию, лишенную этих основных элементов.
  2. Источник данных. Я работаю в Riverus, юридической технологической компании, деятельность которой направлена ​​на упрощение законодательства как для практикующих врачей, так и для простых людей.