Update phishing_email_detection_gpt2.py

david-thrower · Dec 8, 2023 · 01a3df0 · 01a3df0
1 parent d092dc6
commit 01a3df0
Showing 1 changed file with 16 additions and 1 deletion.
diff --git a/phishing_email_detection_gpt2.py b/phishing_email_detection_gpt2.py
@@ -118,6 +118,20 @@ def from_config(cls, config):
         #
         return cls(max_seq_length=config['max_seq_length'])
 
+
+
+
+class CastToFloat32(tf.keras.layers.Layer):
+    def __init__(self, **kwargs):
+        super(CastToFloat32, self).__init__(**kwargs)
+
+    def call(self, inputs):
+        return tf.cast(inputs, tf.float32)
+
+    def get_config(self):
+        return super(CastToFloat32, self).get_config()
+
+
 # GPT2 configurables
 
 max_seq_length = 250
@@ -147,8 +161,9 @@ def from_config(cls, config):
 # I think concatenating the embedded and 
 # un-embedded tokens may emulate a wide and deep model. 
 # Worth a try.
+float_tokens = CastToFloat32()(tokens)
 concatenated_inputs =\
-    tf.keras.layers.Concatenate(axis=1)([flattened, tokens])
+    tf.keras.layers.Concatenate(axis=1)([flattened, float_tokens])
 
 tokenized_embedded_model=\
     tf.keras.Model(