Получить информацию о байт-коде (зависимости) из файлов .class через Java

Я хотел бы проанализировать файлы .class и получить информацию о том, какой класс использует какой другой класс.

jdeps — это инструмент командной строки, который позволяет отображать некоторую информацию в консоли, но я хотел бы избежать вызова внешнего инструмента и очистки вывода командной строки.


person J Fabian Meier    schedule 25.04.2018    source источник


Ответы (1)


Все зависимости записываются в центральном месте файла класса, в постоянном пуле. Таким образом, для эффективной обработки всех зависимостей вам нужна библиотека, позволяющая обрабатывать пул констант, не просматривая остальную часть файла класса (что исключает ASM, который в остальном является очень хорошей библиотекой для обработки байт-кода).

Таким образом, используя, например. Javassist, вы можете выполнить эту работу как

private static Set<String> getDependencies(InputStream is) throws IOException {
    ClassFile cf = new ClassFile(new DataInputStream(is));
    ConstPool constPool = cf.getConstPool();
    HashSet<String> set = new HashSet<>();
    for(int ix = 1, size = constPool.getSize(); ix < size; ix++) {
        int descriptorIndex;
        switch (constPool.getTag(ix)) {
            case ConstPool.CONST_Class: set.add(constPool.getClassInfo(ix));
            default: continue;
            case ConstPool.CONST_NameAndType:
                descriptorIndex = constPool.getNameAndTypeDescriptor(ix);
                break;
            case ConstPool.CONST_MethodType:
                descriptorIndex = constPool.getMethodTypeInfo(ix);
        }
        String desc = constPool.getUtf8Info(descriptorIndex);
        for(int p = 0; p<desc.length(); p++)
            if(desc.charAt(p)=='L')
                set.add(desc.substring(++p, p = desc.indexOf(';', p)).replace('/', '.'));
    }
    return set;
}

Тестирование с помощью

try(InputStream is = String.class.getResourceAsStream("String.class")) {
    set = getDependencies(is);
}
set.stream().sorted().forEachOrdered(System.out::println);

показывает

[B
[C
[I
[Ljava.lang.CharSequence;
[Ljava.lang.String;
java.io.ObjectStreamField
java.io.Serializable
java.io.UnsupportedEncodingException
java.lang.AbstractStringBuilder
java.lang.CharSequence
java.lang.Character
java.lang.Comparable
java.lang.Double
java.lang.Float
java.lang.IndexOutOfBoundsException
java.lang.Integer
java.lang.Iterable
java.lang.Long
java.lang.Math
java.lang.NullPointerException
java.lang.Object
java.lang.OutOfMemoryError
java.lang.String
java.lang.String$1
java.lang.String$CaseInsensitiveComparator
java.lang.StringBuffer
java.lang.StringBuilder
java.lang.StringCoding
java.lang.StringCoding$Result
java.lang.StringIndexOutOfBoundsException
java.lang.StringLatin1
java.lang.StringLatin1$CharsSpliterator
java.lang.StringUTF16
java.lang.StringUTF16$CharsSpliterator
java.lang.StringUTF16$CodePointsSpliterator
java.lang.System
java.lang.Throwable
java.lang.Void
java.nio.charset.Charset
java.util.ArrayList
java.util.Arrays
java.util.Comparator
java.util.Formatter
java.util.Iterator
java.util.List
java.util.Locale
java.util.Objects
java.util.Spliterator
java.util.Spliterator$OfInt
java.util.StringJoiner
java.util.regex.Matcher
java.util.regex.Pattern
java.util.stream.IntStream
java.util.stream.StreamSupport

(на Java 9)


Вы можете получить тот же результат, используя BCEL:

private static Set<String> getDependencies(InputStream is) throws IOException {
    JavaClass cf = new ClassParser(is, "").parse();
    ConstantPool constPool = cf.getConstantPool();
    HashSet<String> set = new HashSet<>();
    constPool.accept(new DescendingVisitor(cf, new EmptyVisitor() {
        @Override public void visitConstantClass(ConstantClass cC) {
            set.add(((String)cC.getConstantValue(constPool)).replace('/', '.'));
        }
        @Override public void visitConstantNameAndType(ConstantNameAndType cNaT) {
            processSignature(cNaT.getSignature(constPool));
        }
        @Override public void visitConstantMethodType(ConstantMethodType cMt) {
            processSignature(
                constPool.constantToString(cMt.getDescriptorIndex(),
                (byte)ConstPool.CONST_Utf8));
        }
        private void processSignature(String desc) {
            for(int p = 0; p<desc.length(); p++)
                if(desc.charAt(p)=='L')
                    set.add(desc.substring(++p, p=desc.indexOf(';', p)).replace('/', '.'));
        }
    }));
    return set;
}
person Holger    schedule 26.04.2018
comment
Я очень-очень надеялся, что ты ответишь на этот вопрос! - person Eugene; 26.04.2018
comment
Спасибо. Что означают первые пять записей (со знаком [ в начале)? - person J Fabian Meier; 26.04.2018
comment
@JFMeier эти имена находятся в "Двоичные имена, тогда как [B, [C, [I обозначают byte[], char[] и int[]. [Ljava.lang.CharSequence; и [Ljava.lang.String; относятся к CharSequence[] и String[]. По сути, это внутреннее имя JVM, но / заменено на .. - person Holger; 26.04.2018