models/tc_lstm.py

# -*- coding: utf-8 -*-
# The code is based on repository: https://github.com/songyouwei/ABSA-PyTorch
# author: Runjia Zeng <rain1709@foxmail.com>

import mindspore
import numpy as np
from layers.dynamic_rnn import DynamicLSTM

class TC_LSTM(mindspore.nn.Cell):
    def __init__(self, embedding_matrix, opt):
        super(TC_LSTM, self).__init__()
        rows, cols = embedding_matrix.shape
        self.embed = mindspore.nn.Embedding(rows, cols, embedding_table=mindspore.tensor(embedding_matrix, dtype=mindspore.float32))
        self.lstm_l = DynamicLSTM(opt.embed_dim * 2, opt.hidden_dim, num_layers=1, batch_first=True)
        self.lstm_r = DynamicLSTM(opt.embed_dim * 2, opt.hidden_dim, num_layers=1, batch_first=True)
        self.dense = mindspore.nn.Dense(opt.hidden_dim*2, opt.polarities_dim)

    def construct(self, inputs):
        # Get the target and its length(target_len)
        x_l, x_r, target = inputs[0], inputs[1], inputs[2]
        t_1, t_2 = mindspore.tensor(np.array(x_l) != 0, mindspore.int32), mindspore.tensor(np.array(x_r) != 0, mindspore.int32)
        x_l_len, x_r_len = mindspore.ops.sum(t_1, dim=-1), mindspore.ops.sum(t_2, dim=-1)
        t_3 = mindspore.tensor(np.array(target) != 0, mindspore.int32)
        target_len = mindspore.ops.sum(t_3, dim=-1, dtype=mindspore.float32)[:, None, None]
        x_l, x_r, target = self.embed(x_l), self.embed(x_r), self.embed(target)
        v_target = mindspore.ops.div(target.sum(axis=1, keepdims=True),
                             target_len)  # v_{target} in paper: average the target words

        # the concatenation of word embedding and target vector v_{target}:
        x_l = mindspore.ops.cat(
            (x_l, mindspore.ops.cat(([v_target] * x_l.shape[1]), 1)),
            2
        )
        x_r = mindspore.ops.cat(
            (x_r, mindspore.ops.cat(([v_target] * x_r.shape[1]), 1)),
            2
        )

        _, (h_n_l, _) = self.lstm_l(x_l, x_l_len)
        _, (h_n_r, _) = self.lstm_r(x_r, x_r_len)
        h_n = mindspore.ops.cat((h_n_l[0], h_n_r[0]), axis=-1)
        out = self.dense(h_n)
        return out