Что такое Scalafix?
Scalafix - это инструмент для линтинга (Linting) и рефакторинга (Rewriting) кода написанного на Scala. Основной его целью является упрощение процесса миграции кодовой базы на новые версии Scala, на новые версии библиотек или применение определенных практик программирования в больших проектах. Так же Scalafix помогает улучшить качество кода, сделать его более читаемым, устранить типичные ошибки, а также соблюсти принятый в проекте coding conventions.
Как работает Scalafix?
Scalafix предоставляет синтаксическое и семантическое API, которое разработчики могут использовать для написания пользовательских правил линтинга и рефакторинга кода. Синтаксическая информация получается из парсера Scalameta, а семантическая информация загружается из файлов SemanticDB, создаваемых плагином компилятора semanticdb-scalac (который запускается после фазы typer
).
Под капотом Scalafix использует Scalameta - это библиотека метапрограммирования для языка Scala, которая обеспечивает простой и унифицированный интерфейс для чтения, анализа, изменения и генерирования Scala кода. А именно:
- парсинг кода и получение синтаксических деревьев
- обход и матчинг синтаксических деревьев
- трансформация синтаксических деревьев
- конструирование новых синтаксических деревьев
Вот так выглядит пример генерирования AST:
Если интересно, в astexplorer.net можно глянуть как примерно будет выглядеть AST:
Scalameta предоставляет квазиквоты (Quasiquotes), которые позволяют создавать и деконструировать синтаксические деревья удобным способом для чтения и дальнейшей поддержки.
При размещении фрагмента кода в q"..."
оно превращается в синтаксическое дерево, представляющее этот код. Так же квазиквоты можно использовать при паттерн матчинге.
Scalameta предоставляет SemanticDB — модель данных для хранения семантической информации, такой как символы и типы. Благодаря SemanticDB:
- Scalafix позволяет реализовывать правила без изучения внутреннего устройства компилятора
- Scalafix не привязан к внутреннему устройству компилятора, а это означает, что он может беспрепятственно работать с любой версией компилятора, поддерживающей плагин компилятора SemanticDB.
Правила Scalafix
Правила бывают синтаксические и семантические:
- Синтаксическое правило может выполняться без предварительной компиляции. Синтаксические правила просты в использовании, но они могут выполнять лишь ограниченный анализ кода, поскольку у них нет доступа к такой информации, как символы и типы.
- Семантическое: правило требует, чтобы код был предварительно скомпилирован компилятором Scala и плагином компилятора SemanticDB. Семантические правила позволяют выполнять более сложный анализ кода на основе символов и типов.
Существующие правила
Scalafix поставляется с набором встроенных правил, например:
- DisableSyntax - позволяет запретить использование определенных синтаксических конструкций, таких как
var
,while
и др. - ExplicitResultTypes - требует явного указания типов возвращаемых значений для методов и переменных
- OrganizeImports - упорядочивает и оптимизирует импорты, удаляет неиспользуемые и группирует их в соответствии с заданными правилами
- RemoveUnused - удаляет неиспользуемый код
- и другие
Так же можно найти правила написанные комьюнити:
Использование правил в проекте
Подключаем и настраиваем правила в файле .scalafix.conf
.
И запускаем scalafix
для анализа и исправления кода:
При необходимости (не мы такие, а жизнь такая) правила можно точечно вырубать используя комментарии:
Пишем свои правила
В начале давайте разберемся - зачем писать свои правила? Как упоминалось ранее, возможно есть потребность упростить процесс миграции кодовой базы на новые версии Scala или на новые версии библиотек. Или же есть потребность применения определенных практик программирования в проектах с помощью правил линтинга и рефакторинга чтобы во время ревью уделять больше времени обсуждению важных вопросов, а не соблюдению договоренностей о том как писать код в проекте.
Прежде чем начинать писать правила стоит ответить на следующие вопросы:
- Нужно правило линтинга или рефакторинга? - Правила рефакторинга могут автоматически исправлять код, но решают только проблемы, имеющие однозначные решения. Правила линтинга могут подсветить проблемные участки кода, требуя от программиста их устранения. Линтеры не ограничиваются проблемами, имеющими однозначные решения.
- Правило должно быть синтаксическим или семантическим? - Синтаксические правила запускаются быстрее, поскольку они не требуют предварительной компиляции кода, но при этом могут выполнять лишь ограниченный анализ, поскольку у них нет доступа к метаданным. Семантические правила выполняются медленнее, поскольку они требуют компиляции, но зато, имея доступ к символам и типам, они способны выполнять более сложный анализ кода.
- Какие изменения должно делать правило рефакторинга? Перед тем, как внедрять правило, полезно сначала вручную выполнить миграцию/рефакторинг нескольких примеров. Предварительный ручной рефакторинг позволит обнаружить корнер-кейсы и оценить сложность правила.
- Как часто правило будет запускаться? Вам нужен одноразовый скрипт миграции или нужно правило, которое, будет использоваться часто и не только лишь вами? Во втором случае, в идеале правило должно иметь юнит-тесты и документацию, чтобы его было проще поддерживать.
Структура правила
Самый быстрый способ создать проект с правилами - это использовать шаблон проекта scalafix.g8
:
Структура проекта будет иметь следующий вид
- В папке
rules
будут лежать файлы с имплементацией правил - В папке
input
будет лежать код, который будет проанализирован правилами и там же лежат тесты для правил линтинга - В папке
output
будет лежать тот же код, что и вinput
, но с ожидаемыми изменениями после прогона правил рефакторинга
Как упоминалось ранее, правила бывают синтаксические и семантические. При реализации правила, необходимо использовать соответствующий интерфейс:
- Для синтаксического правила
- Для семантического правила
Имплементация правила должна делать следующее - ищет интересующий кусок кода и далее, в зависимости от типа правила (линтинг или рефакторинг), правило либо вносит изменения в код, либо выводит диагностическое сообщение.
Как создать правило линтера
Допустим, в нашем coding convention есть пункт:
Это означает, что мы хотим в коде запретить делать new Exception("Message")
. Это можно описать правилом, который будет выглядеть примерно так.
- В этом правиле ищем выражения
Term.New(_)
, которые представляют создание инстанса класса - Для каждого найденного
Term.New
проверяется, является ли создаваемый инстанс классаException
- Если обнаружен
Exception
, создается сообщение о запрете создания таких экземпляров с помощьюDiagnostic
Ну и следующим образом будет выглядеть тест для правила:
Как создать правило рефакторинга
Scalafix предоставляет список методов, которые позволяют править код:
Patch.addLeft()
- позволяет вставить строковое значение слева от узла синтаксического дереваPatch.addRight()
- позволяет вставить строковое значение справа от узла синтаксического дереваPatch.removeToken()
- удаляет кодPatch.replaceTree()
- заменяет синтаксическое дерево на новоеPatch.removeImportee()
- удаляет импортPatch.atomic
- гарантирует, что патчи применяются только целиком и учитывают suppress-комментарии// scalafix:off
К примеру, мы хотим чтобы у нас в коде именовались аргументы функций с булевыми типами.
Для этого можно написать правило (взял отсюда), которое делает следующее:
- Пробегаемся по всему AST и ищем вызовы функций
- Получаем метаинформацию о функции, которая вызывается
- Проверяем, что функция содержит аргументы, причем интересуют только параметры с булевыми типами
- Извлекаем название параметра и делаем патч, добавляющий имя параметра перед значением аргумента
Заключение
Scalafix является мощным инструментом для рефакторинга и линтинга Scala кода и возможность писать собственные правила расширяет его возможности, позволяя адаптировать инструмент под конкретные нужды в вашем проекте.
Ссылки
Более детально про то, как писать правила, как сделать так чтобы правила были конфигурируемыми и другие нюансы можно почитать в документации.
Дополнительно:
- https://www.scala-lang.org/blog/2016/10/24/scalafix.html
- https://www.scala-lang.org/blog/2018/11/16/scalafix-scalameta.html
- https://docs.scala-lang.org/overviews/quasiquotes/intro.html
- https://scalameta.org/docs/trees/guide.html
- https://medium.com/@Arhelmus/metaprogramming-magic-with-scalameta-67e849ab490e
- https://reintech.io/blog/exploring-scalameta-library-in-scala